搜索资源 - 策略梯度 - 搜珍网

CDN加速镜像 | 设为首页 | 加入收藏夹

热门搜索： 源码 Android 整站插件识别 p2p OpenCV 网络编程游戏源码算法更多...

登陆 | 会员注册

当前位置：

数值算法/人工智能

搜索资源 - 策略梯度

下载资源主分类

源码下载

Web源码

开发工具

文档下载

其它资源

资源分类

压缩解压

STL

数据结构常用算法

数学计算/工程计算

人工智能/神经网络/遗传算法

matlab例程

生物技术

密码/编码算法

mathematica

Maple

数据挖掘

大数据

comsol

物理计算

化学计算

仿真建模

搜索资源列表

policygradientlibrary

2下载：
pomdp中关于策略梯度的matlab代码实现，非常详细。-pomdp on strategies to achieve gradient matlab code, very detailed.
所属分类：matlab
- 发布日期：2017-04-16
- 文件大小：84.9kb
- 提供者：小小

bpnnet_154

3下载：
L-M算法。除了动量法(基于梯度下降的训练算法)外，学习率自适应调整策略是BP算法改进的另一种途径，它利用Levenberg-Marquardt优化方法，从而使得学习时间更短。其缺点是，对于复杂的问题，该方法需要很大的存储空间。 -L-M algorithm. In addition to momentum (based on the gradient descent algorithm for training), learning rate adaptive strategy is to i
所属分类：AI-NN-PR
- 发布日期：2017-11-16
- 文件大小：942byte
- 提供者：辜小花

PSO_BP

3下载：
基于粒子群和BP神经网络的混合优化策略算法。将改进PSO算法与BP神经网络结合，用PSO算法取代梯度下降法来优化神经网络的连接权值和阈值。程序简单易懂。-Based on Particle Swarm and the BP neural network algorithm for hybrid optimization strategy. Will improve the PSO algorithm and BP neural network, using PSO algorithm to re
所属分类：AI-NN-PR
- 发布日期：2017-04-02
- 文件大小：184.21kb
- 提供者：李洋

RSGA

0下载：
遗传算法(GA)是一类借鉴生物界自然选择和遗传原理的随机优化搜索算法。其主要特点是群体搜索策略和群体中个体间的信息交换、搜索不依赖于梯度信息。-Genetic algorithms (GA) is a type of reference biological principle of natural selection and random genetic optimization search algorithm. Its main feature is a group of search s
所属分类：AI-NN-PR
- 发布日期：2017-03-30
- 文件大小：25.89kb
- 提供者：郝秀平

GA

0下载：
经典遗传算法的matlab仿真,遗传算法是一类借鉴生物界自然选择和自然遗传机制的随机化搜索算法，其主要特点是群体搜索策略和群体中个体之间的信息交换，搜索不依赖于梯度信息。-good genetic algorithm matlab code
所属分类：AI-NN-PR
- 发布日期：2017-04-08
- 文件大小：1.23kb
- 提供者：fujinmei

policygradientlibrary

0下载：
策略梯度，自然策略梯度，行动者-评论家 -policy gradient
所属分类：Compress-Decompress algrithms
- 发布日期：2017-12-02
- 文件大小：90.26kb
- 提供者：zhuwenwen

1709.04326

0下载：
多智能体设置在机器学习中的重要性日益突出。超过了最近的大量关于深度的工作多agent强化学习，层次强化学习，生成对抗网络和分散优化都可以看作是这种设置的实例。然而，多学习代理人的存在这些设置使得培训问题的非平稳常常导致不稳定的训练或不想要的最终结果。我们提出学习与对手的学习意识（萝拉），一种方法，原因的预期。其他代理的学习。罗拉学习规则包括一个额外的术语，解释了在预期的参数更新的代理政策其他药物。我们发现，利用似然比策略梯度更新的方法，可以有效地计算萝拉更新规则，使该方法适合于无模型强化学习。这
所属分类：人工智能/神经网络/深度学习
- 发布日期：2017-12-31
- 文件大小：1.08mb
- 提供者：我去六六六

sequence_gan

0下载：
TensorFlow实现自然语言处理，基于梯度策略算法(Use TensorFlow to deal with the Natural Language Processing)
所属分类：人工智能/神经网络/深度学习
- 发布日期：2018-05-03
- 文件大小：599kb
- 提供者：允耳在心

Python实现逻辑回归与梯度下降策略

1下载：
建立一个逻辑回归模型来预测一个大学生是否被大学录取(Establish a logistic regression model to predict whether a college student will be admitted to a university)
所属分类：人工智能/神经网络/深度学习
- 发布日期：2020-12-22
- 文件大小：3kb
- 提供者：白开水。

强化学习

1下载：
使用强化学习实现策略梯度和和马尔科夫决策过程(Implementing Strategic Gradient Sum and Markov Decision Process with Reinforcement Learning)
所属分类：人工智能/神经网络/深度学习
- 发布日期：2020-11-17
- 文件大小：50kb
- 提供者：为卿醉

搜珍网 www.dssz.com

本网站为编程资源及源代码搜集、介绍的搜索网站，版权归原作者所有！　　粤ICP备11031372号

1999-2046 搜珍网 All Rights Reserved.