搜索资源列表
NLMS
- 若不希望用与估计输入信号矢量有关的相关矩阵来加快LMS算法的收敛速度,那么可用变步长方法来缩短其自适应收敛过程,其中一个主要的方法是归一化LMS算法(NLMS算法),变步长 的更新公式可写成 W(n+1)=w(n)+ e(n)x(n) =w(n)+ (3.1) 式中, = e(n)x(n)表示滤波权矢量迭代更新的调整量。为了达到快速收敛的目的,必须合适的选择变步长 的值,一个可能策略是尽可能多地减少瞬时平方误差,即用瞬时平方误差作为均方误差的MSE简单估计,这也是LMS算法的基本思想
MDPtoolbox
- 马尔科夫决策过程值迭代算法value iteration,策略迭代等函数代码,从国外网站下载,非常详细,有用。-Markov decision process value iteration algorithm value iteration, policy iteration and so the function code, from the foreign website, very detailed and useful.
knapsack
- 程序设计思路 在动态规划中,可将一个问题的解决方案视为一系列决策的结果,要考察每个最优决策序列中是否包含一个最优子序列。所以在最短路径问题中,假如在的第一次决策时到达了某个节点v,那么不管v 是怎样确定的,此后选择从v 到d 的路径时,都必须采用最优策略。利用最优序列由最优子序列构成的结论,可得到f 的递归式。f ( 1 ,c) 是初始时背包问题的最优解。可使用(1)中所示公式通过递归或迭代来求解f ( 1 ,c)。从f (n, * )开始迭式, f (n, * )由第一个式子得出,然后由
GuoA
- 郭涛算法(GuoA)是基于子空间搜索(多父体重组)和群体爬山法相结合的演化算法。它通过利用少数个体所张成的子空间随机生成新的个体,体现了随机搜索的非凸性。此外,由于GuoA算法采用了单个体劣汰策略,算法在每次演化 迭代中,只把群体中适应性能最差的个体淘汰出局,淘汰压力 较小,既保证了群体的多样性,又可使具有较好适应性的个体能够一直保留。实践证明, GuoA算法具有较好的坚韧性,对于不同的优化问题无须修改算法的参数,而且效率很高,可能同时找到多个最优解。-Guo Tao algorithm
ImageRegistration
- 进一步解决基于互信息的配准算法在配准精度、速度和误配率之间的相互制约问题。提出一种新的配准参数搜索策略——三级配准,将平移、旋转参数分开搜索;在分析互信息配准的优点和局限性的基础上,将模糊理论中的欧几里德贴近度引入三级 配准过程中。实验结果表明,本文提出的配准策略在保持基于互信息配准精度不变的情况下,迭代步数、配准时间和误配率均有明显改善。-Further resolve the mutual information based registration algorithm in the ali
DM-3
- JAVA设计模式之行为型模式的源码,已经做好分类,以形象的例子来描述创建型模式的11大分类。有模板方法、观察者、状态、策略、职责、命令、访问者、调停者、备忘录、迭代器、解释器模式-JAVA Design Pattern of behavior-based model of source, is well classified, in order to create the image of an example to describe the schema of the 11 major cat
333
- 本文以跨平台桌面办公软件套件项目中的产品测试工作为基础,结合项目特色和敏捷软件测试思想,阐述了以Scrum敏捷开发方法为主、进行短周期迭代开发的软件项目中,软件测试的改进目标、改进策略及具体实现。-In this paper, cross-platform desktop office suite project, product testing, combined with the features and agile software testing project ideas, elabo
pso
- 对微粒群算法结构的改进方案有很多种,对其可分类为:采用多个子种群;改进微粒学习对象的选取策略;修改微粒更新迭代公式;修改速度更新策略;修改速度限制方法、位置限制方法和动态确定搜索空间;与其他搜索技术相结合;以及针对多模问题所作的改进。-Structure of the particle swarm algorithm to improve the program there are many, its can be classified as: the use of multiple sub-p
asw
- 迭代控制在动态电压恢复器控制策略中的应用.-Iterative learning control for dynamic voltage restorer control strategies in the application
Simulated-Annealing
- 模拟退火算法(Simulated Annealing,SA),基于Mente-Carlo迭代求解策略的一种随机寻优算法-Simulated Annealing algrithm
MDP-model-of-MPNP
- 在matlab平台上,针对多周期报童问题,采用值迭代算法、策略迭代算法和强化学习算法求解MDP模型的实例-This is an example presentting how to apply value-iteration algorithm,policy-iteration algorithm and reinforcement learning algorithm to MDP model, which aims to solve the multi-period newsboy prob
policyi
- 如何用matlab实现MDP中的值迭代算法或者策略迭代法-Markov decision process value iteration algorithm value iteration
CleanRobot
- 清洁机器人,确定情况,随机情况,策略迭代,Q值计算,人工智能实验-Cleaning robot to determine the situation, the random case, policy iteration, Q value, artificial intelligence experiment
inverted-pendulum-control
- 利用强化学习的自适应动态规划中的值迭代和策略迭代方法,神经网络控制方法,LQR状态调节器最优控制方法,实现了三维倒立摆在飞行器上的稳定控制。鲁棒性很强,进行了高斯白噪声的扰动实验。-Reinforcement learning adaptive dynamic programming in value iteration and policy iteration method, neural network control method, LQR state regulator optimal
BPidentify_trymodel
- bp网络 策略迭代 算法 ,控制理论与工程必备算法-bppolicy-iteration ,a Reinforcement Learning tool
ES
- 1.设定种群个体数和需要迭代的次数。 2.选择父代中的个体按照公式z1=sqrt(-2*ln(u1))*sin(2*pi*u2)*m,z2=sqrt(-2*ln(u1))*cos(2*pi*u2)*m进行演化。 这里u1,u2都是随机值,m是控制因子,演化次数越多m,m越小,父代通过与z1,z2相加得到后代。 3.计算后代的适应性。 4.选择后代中最优的适应性作为全局最优适应性。(1. set the number of individuals in the population and
归档
- 值迭代算法 mdp 策略迭代算法 基本问题(Value iterative algorithm)
迭代最近点算法综述
- 三维点集配准问题是计算机技术中的一个极其重要的问题,作为解决三维点集配准问题的一个应用较为广泛的算法,ICP算法得到了研究者的关注,本文以一种全新的思路从配准元素的选择、配准策略的确定和误差函数的求解等3个方面对三维点集配准的ICP算法的各种改进和优化进行了分类和总结。(The three-dimensional point set registration problem is an extremely important issue in computer technology. As an
Dynamic-Programming-master
- 经典的基于策略迭代和值迭代法的动态规划matlab代码,实现机器人的最优运输(The classic dynamic programming matlab code based on policy iteration and value iteration method realizes the optimal transportation of the robot.)
迭代功率控制达到纳什均衡
- 迭代功率选择,运用博弈论循环迭代功率分配策略,使系统性能达到最优(Iterative power selection and iterative power allocation strategy based on game theory make the system performance optimal.)