文件名称:万门大学强化学习算法代码RW模型+TD模型
-
所属分类:
- 标签属性:
- 上传时间:2018-04-11
-
文件大小:1kb
-
已下载:1次
-
提 供 者:
-
相关连接:无下载说明:别用迅雷下载,失败请重下,重下不扣分!
介绍说明--下载内容来自于网络,使用问题请自行百度
万门大学,强化学习,rw模型算法代码实现,
V(CS) = V(CS) + A * ( V(US) * us - V(CS) * cs )
td模型,
V(s{t}) = V(s{t}) + a[R(t+1) + rV{S(t+1)} - V{S(t)}](In the intensive learning of the University of Wan men, the RW algorithm, the python implementation, the algorithm formula are as follows.
V(CS) = V(CS) + A * ( V(US) * us - V(CS) * cs )
the TD algorithm.
V(s{t}) = V(s{t}) + a[R(t+1) + rV{S(t+1)} - V{S(t)}])
V(CS) = V(CS) + A * ( V(US) * us - V(CS) * cs )
td模型,
V(s{t}) = V(s{t}) + a[R(t+1) + rV{S(t+1)} - V{S(t)}](In the intensive learning of the University of Wan men, the RW algorithm, the python implementation, the algorithm formula are as follows.
V(CS) = V(CS) + A * ( V(US) * us - V(CS) * cs )
the TD algorithm.
V(s{t}) = V(s{t}) + a[R(t+1) + rV{S(t+1)} - V{S(t)}])
(系统自动生成,下载前可以参看下载内容)
下载文件列表
文件名 | 大小 | 更新时间 |
---|---|---|
1conditioning_RW_Mode.zip | 631 | 2018-04-11 |
2general_TD.zip | 556 | 2018-04-11 |
本网站为编程资源及源代码搜集、介绍的搜索网站,版权归原作者所有! 粤ICP备11031372号
1999-2046 搜珍网 All Rights Reserved.