搜索资源列表
srcV0624
- 这个代码是policy iteration算法关于强化学习的. 请您用winzip 解压缩-policy iteration algorithm for enhanced learning. Please use winzip decompress
43gwfdfd
- 农业决策咨询信息网络化特征的分析研究,很不错的-Agricultural Policy Advisory Information Network Features analysis, it is very good
asm_javasrc
- 在这个电脑中的虚拟市场中,若干被称为交易者的人工智能程序(Agent)通过观察它们所在的数字世界中 股价和股息的不断变换而做出预测,并且根据这些预测做出购买股票与否以及购买股票数量的决策。 反过来,所有的交易者的决策又决定了股票的价格,这样,整个的股票交易市场就构成了一个自我封闭的 计算系统。同时,这些交易者都具有学习的能力,可以根据以前预测的成功或者失败对自己的决策进行调整 ,并且通过一种被称为遗传算法的方法产生创新能力。总之,ASM是一个电脑中不断进化的虚拟股票市场! 通
guzhangzhuanjiaxitong
- 故障诊断专家系统是将人类在故障诊断方面的多位 专家具有的知识、 经验、 推理、 技能综合后编制成的大型计 算机程序, 它可以利用计算机系统帮助人们分析解决只能 用语言描述、 思维推理的复杂问题, 扩展计算机系统原有 的工作范围使计算机系统有了思维能力, 能够与决策者进 行 “对话” , 并应用推理方式提供决策建议, 专家系统在故 障诊断领域的应用非常广泛, 故障检测与诊断技术与专家 系统相结合, 使工程的安全性与可靠性得到保证。-Fault diagnosis exp
GANotes
- Genetic algorithms (GA) is an optimization technique for searching very large spaces that models the role of the genetic material in living organisms. A small population of individual exemplars can eectively search a large space because they c
CleanRobot
- 清洁机器人,确定情况,随机情况,策略迭代,Q值计算,人工智能实验-Cleaning robot to determine the situation, the random case, policy iteration, Q value, artificial intelligence experiment
napping
- 非参数政策梯度的napping机制的java代码参考文献:Qing Da, Yang Yu, and Zhi-Hua Zhou. Napping for Functional Representation of Policy. In: Proceedings of the 2014 International Conference on Autonomous Agents and Multi-Agent Systems (AAMAS 14), Paris, France, 2014.-This
AutoFiboTrend
- 一款网格类EA,有祥细的操作说明,可以策试一下哦-A Grid class EA, Xiangxi operating instructions, you can try oh policy
inverted-pendulum-control
- 利用强化学习的自适应动态规划中的值迭代和策略迭代方法,神经网络控制方法,LQR状态调节器最优控制方法,实现了三维倒立摆在飞行器上的稳定控制。鲁棒性很强,进行了高斯白噪声的扰动实验。-Reinforcement learning adaptive dynamic programming in value iteration and policy iteration method, neural network control method, LQR state regulator optimal
QGA
- 本程序对量子遗传算法中的量子旋转门的调整策略进行改进,并应用于旅行商(TSP)的适应度问题-Fitness problems this procedure quantum genetic algorithm quantum revolving door policy adjustment is improved and applied to the traveling salesman (TSP) of
pi.py
- Reinforcement Learning policy iteration algorithm