搜索资源列表
rl
- 人工神经网络(Aartificial Neural Network,下简称ANN)是模拟生物神经元的结构而提出的一种信息处理方法。早在1943年,已由心理学家Warren S.Mcculloch和数学家Walth H.Pitts提出神经元数学模型,后被冷落了一段时间,80年代又迅猛兴起[1]。ANN之所以受到人们的普遍关注,是由于它具有本质的非线形特征、并行处理能力、强鲁棒性以及自组织自学习的能力。其中研究得最为成熟的是误差的反传模型算法(BP算法,Back Propagation),它的网络
RL_Learning
- 详细的讲述强化学习中Q学习算法,并且应用在区域交通系统中,是适合初学者。-RL—learning,q_learning,transform system,for beginner
suntton-RL-book-demo
- sutton强化学习书籍的所有matlab例子,学习很有用,不易找到-all matlab demo about sutton s book for reinforcement learning
RL-in-Multi-Continuous-Action-Spaces
- 机器学习,大规模连续行为空间的强化学习算法研究及其应用分析-Machine learning, large-scale study of reinforcement learning algorithm continuously analyzes the behavior of space and its applications
DQN
- 谷歌DeepMind2015年2月发表的人工智能算法,可以在雅达利2600游戏机的49个游戏中击败人类专业玩家-human-level control through RL
1709.04326
- 多智能体设置在机器学习中的重要性日益突出。超过了最近的大量关于深度的工作多agent强化学习,层次强化学习,生成对抗网络和分散优化都可以看作是这种设置的实例。然而,多学习代理人的存在这些设置使得培训问题的非平稳常常导致不稳定的训练或不想要的最终结果。我们提出学习与对手的学习意识(萝拉),一种方法,原因的预期。其他代理的学习。罗拉学习规则包括一个额外的术语,解释了在预期的参数更新的代理政策其他药物。我们发现,利用似然比策略梯度更新的方法,可以有效地计算萝拉更新规则,使该方法适合于无模型强化学习。这
RL
- 用python搭建了各类常用的强化学习算法的框架,通过迷宫寻路的例子实现各类算法。(The framework of all kinds of commonly used reinforcement learning algorithms is built with Python, and all kinds of algorithms are realized by the example of labyrinth finding.)
RL
- 强化学习 DQN代码,和通信相关,利用python进行训练,大家可以看看(reinforcement learning)