搜索资源 - Q LEARNING - 搜珍网

CDN加速镜像 | 设为首页 | 加入收藏夹

热门搜索： 源码 Android 整站插件识别 p2p OpenCV 网络编程游戏源码算法更多...

登陆 | 会员注册

当前位置：

通讯/手机编程

搜索资源 - Q LEARNING

下载资源主分类

源码下载

Web源码

开发工具

文档下载

其它资源

搜索资源列表

ReinforcementLearning

0下载：
马尔卡夫决策过程理论定义了一个数学模型，可用于随机动态系统的最优决策过程。强化学习利用这个数学模型将一个现实中的问题变成一个数学问题。强化学习就是：追求最大回报G 追求最大回报G就是：找到最优的策略π?。策略π?告诉在状态s，应该执行什么行动a。最优策略可以由最优价值方法v?(s)或者q?(s,a)决定(The Markov decision process theory defines a mathematical model that can be used for the
所属分类：通讯编程
- 发布日期：2018-01-01
- 文件大小：1kb
- 提供者：下雪

IET_QLRSA

1下载：
用Q-Learning实现中继选择，选择最佳中继进行通信传输(Realization of Relay Selection with Q-Learning)
所属分类：通讯编程
- 发布日期：2021-01-04
- 文件大小：1kb
- 提供者：summer灬

搜珍网 www.dssz.com

本网站为编程资源及源代码搜集、介绍的搜索网站，版权归原作者所有！　　粤ICP备11031372号

1999-2046 搜珍网 All Rights Reserved.