原文:LQR和iLQR、DDP

LQR直接通过backward和forward 过程给出最控制率和轨迹,而iLQR初始化一条轨迹,然后用LQR动态优化这条轨迹,直到找到最优解 LQR是在环境线性化模型 cost function二次型情况下进行的,可能不能表示真是环境的情况 于是,近似于数值优化中的思路,iLQR是将环境一阶线性化,cost function 二阶泰勒近似,然后利用LQR求极值,在新极值的条件下, 再次将环境一阶 ...

2020-11-11 11:19 0 611 推荐指数:

查看详情

iLQR算法

参考 有模型的强化学习 LQRiLQR ...

Fri Feb 25 00:39:00 CST 2022 0 743
LQR要点

新的“A”变成着了这样:Ac = A - KB 基于对象:状态空间形式的系统 能量函数J:也称之为目标函数 Q:半正定矩阵,对角阵(允许对角元素出现0) R:正定矩阵,QR其实就是权重 下面这段话可能会加深对LQR的理解: 当x是一维的,J就变成 我们的目的 ...

Mon May 21 21:29:00 CST 2018 0 1153
Matlab解析LQR与MPC的关系

mathworks社区中的这个资料还是值得一说的。 我们从几个角度来解析两者关系,简单的说就是MPC是带了约束的LQR. 在陈虹模型预测控制一书中P20中,提到在目标函数中求得极值的过过程中,相当于对输出量以及状态量相当于加的软约束 而模型预测控制与LQR中其中不同的一点 ...

Thu Nov 12 21:27:00 CST 2020 0 834
Apollo代码学习(七)—MPC与LQR比较

前言 Apollo中用到了PID、MPC和LQR三种控制器,其中,MPC和LQR控制器在状态方程的形式、状态变量的形式、目标函数的形式等有诸多相似之处,因此结合自己目前了解到的信息,将两者进行一定的比较。 MPC( Model predictive control, 模型预测控制 ...

Thu Nov 12 21:29:00 CST 2020 0 1136
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM