查看会员资料
用 户 名:学数学***
发送消息- Email:用户隐藏
- Icq/MSN:
- 电话号码:
- Homepage:
- 会员简介:
最新会员发布资源
Q-learning
- 强化学习的核心算法,Q-table,应用动作值函数对动作的Q值进行更新来找到最优策略。(The core algorithm of reinforcement learning, Q-table, uses action value function to update the Q value of actions to find the optimal strategy.)