搜索资源 - Markov Decision Process - 搜珍网

CDN加速镜像 | 设为首页 | 加入收藏夹

热门搜索： 源码 Android 整站插件识别 p2p OpenCV 网络编程游戏源码算法更多...

登陆 | 会员注册

当前位置：

通讯/手机编程

搜索资源 - Markov Decision Process

下载资源主分类

源码下载

Web源码

开发工具

文档下载

其它资源

搜索资源列表

MDPtoolbox

0下载：
The MDP toolbox proposes functions related to the resolution of discrete-time Markov Decision Process : finite horizon, value iteration, policy iteration, linear programming algorithms with some variants. The functions (m-functions) were developpe
所属分类：3G开发
- 发布日期：2008-10-13
- 文件大小：2.32mb
- 提供者：劉德華

ReinforcementLearning

0下载：
马尔卡夫决策过程理论定义了一个数学模型，可用于随机动态系统的最优决策过程。强化学习利用这个数学模型将一个现实中的问题变成一个数学问题。强化学习就是：追求最大回报G 追求最大回报G就是：找到最优的策略π?。策略π?告诉在状态s，应该执行什么行动a。最优策略可以由最优价值方法v?(s)或者q?(s,a)决定(The Markov decision process theory defines a mathematical model that can be used for the
所属分类：通讯编程
- 发布日期：2018-01-01
- 文件大小：1kb
- 提供者：下雪

搜珍网 www.dssz.com

本网站为编程资源及源代码搜集、介绍的搜索网站，版权归原作者所有！　　粤ICP备11031372号

1999-2046 搜珍网 All Rights Reserved.