CDN加速镜像 | 设为首页 | 加入收藏夹
当前位置: 首页 资源下载 源码下载 搜索资源 - multi agent reinforcement learning

搜索资源列表

  1. Q_learning

    0下载:
  2. 强化学习是人工智能中策略学习的一种,基于预期最大利益原则。和博弈论有密切的关系,也是多主体系统学习的常用方法。-Reinforcement learning is a kind of artificial intelligence in the strategic study, based on the principle of best interests is expected. And game theory are closely related, but also multi-agen
  3. 所属分类:AI-NN-PR

    • 发布日期:2017-03-31
    • 文件大小:29.05kb
    • 提供者:崔暁魏
  1. whjt05_iros

    0下载:
  2. Multi-Agent Quadrotor Testbed Control Design: Integral Sliding Mode vs. Reinforcement Learning
  3. 所属分类:Crypt_Decrypt algrithms

    • 发布日期:2017-03-29
    • 文件大小:317.25kb
    • 提供者:hacen
  1. Usithod

    0下载:
  2. 利用聚类分析法改进的多Agent协作强化学习方法-Using cluster analysis to improve collaborative multi-Agent Reinforcement Learning Method
  3. 所属分类:Mathimatics-Numerical algorithms

    • 发布日期:2017-03-31
    • 文件大小:196.72kb
    • 提供者:andy752
  1. Mmutti-agentsu

    0下载:
  2. 多智能体工具包,可直接用来进行行多智能体强化学习算法设计与仿真 -Multi-agent toolkit, can be directly used for design and simulation of the line multi-agent reinforcement learning algorithm
  3. 所属分类:Windows Develop

    • 发布日期:2017-04-05
    • 文件大小:141.78kb
    • 提供者:李威
  1. 1709.04326

    0下载:
  2. 多智能体设置在机器学习中的重要性日益突出。超过了最近的大量关于深度的工作多agent强化学习,层次强化学习,生成对抗网络和分散优化都可以看作是这种设置的实例。然而,多学习代理人的存在这些设置使得培训问题的非平稳常常导致不稳定的训练或不想要的最终结果。我们提出学习与对手的学习意识(萝拉),一种方法,原因的预期。其他代理的学习。罗拉学习规则包括一个额外的术语,解释了在预期的参数更新的代理政策其他药物。我们发现,利用似然比策略梯度更新的方法,可以有效地计算萝拉更新规则,使该方法适合于无模型强化学习。这
  3. 所属分类:人工智能/神经网络/深度学习

  1. MAgent-master

    1下载:
  2. 多智能体的一段代码,有关强化学习,机器学习,很实用的一段代码!(A code of multi-agent, about reinforcement learning, machine learning, a very practical piece of code!)
  3. 所属分类:人工智能/神经网络/深度学习

    • 发布日期:2020-02-18
    • 文件大小:8.57mb
    • 提供者:一笑生花
  1. Multi-Agent-Reinforcement-Learning-Environment

    1下载:
  2. 多智能体强化学习环境,用于开发强化学习算法(Multi agent reinforcement learning environment)
  3. 所属分类:人工智能/神经网络/深度学习

    • 发布日期:2020-09-05
    • 文件大小:3.65mb
    • 提供者:wizholy
  1. reinforcement-learning-master

    7下载:
  2. 在障碍物环境下的基于强化学习的单智能体与多智能体路径规划算法(Single agent and multi-agent path planning algorithm based on reinforcement learning in obstacle environment)
  3. 所属分类:matlab例程

    • 发布日期:2020-09-05
    • 文件大小:4.39mb
    • 提供者:郝好好
  1. HDPONLINE

    1下载:
  2. 一段论文的代码实现 论文题目Multi-agent discrete-time graphical games and reinforcement learning solutions(Multi-agent discrete-time graphical games and reinforcement learning solutions)
  3. 所属分类:其他

    • 发布日期:2021-01-06
    • 文件大小:2kb
    • 提供者:liu_yujia
搜珍网 www.dssz.com