欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2020111715450
申请人: 江南大学
专利类型:发明专利
专利状态:已下证
专利领域: 手动工具;轻便机动工具;手动器械的手柄;车间设备;机械手
更新日期:2024-02-23
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种移动机器人变批次长度迭代学习优化控制方法,其特征在于,所述方法包括:建立双后轮独立驱动刚性移动机器人控制系统的动态模型;构建所述双后轮独立驱动刚性移动机器人控制系统的离散状态空间方程;利用随机变量建立批次长度随机变化模型;设计批次长度可变的迭代学习轨迹跟踪优化算法;分析所述批次长度可变的迭代学习轨迹跟踪优化算法的收敛性;在输入约束下设计批次长度可变的迭代学习轨迹跟踪优化算法;分析所述输入约束下的批次长度可变的迭代学习轨迹跟踪优化算法的收敛性;实现批次长度可变的移动机器人控制系统在有输入约束情形下的轨迹跟踪;

第一步、建立双后轮独立驱动刚性移动机器人控制系统的动态模型:所述双后轮独立驱动刚性移动机器人通过两个后轮的不同速度来控制移动机器人的速度和航向,在固定平面内设置绝对坐标XOY,假设所述双后轮独立驱动刚性移动机器人在所述固定平面内移动,所述移动机器人的实际物理模型如下:其中,v表示移动机器人的线速度,θ表示移动机器人的位姿角,ur和ul分别表示右轮和左轮的驱动控制输入,c表示黏性摩擦系数,k表示驱动增益,M1表示移动机器人的质量,Iw表示车轮的转动惯量,Iv表示绕机器人重心的转动惯量,r表示车轮半径,l表示左右轮到机器人重心的距离;

第二步、构建所述双后轮独立驱动刚性移动机器人控制系统的离散状态空间方程:将所述移动机器人的线速度、位姿角和位姿角导数定义为状态变量:定义输入变量为驱动控制输入:u=[ur ul]T,输出变量为所述移动机器人的线速度和位姿角:y=[v θ]T,则式(1)所示的移动机器人控制系统描述为:其中,

对连续系统模型式(2)进行离散化,选取满足香农采样定理的采样周期Ts,进一步得到所述移动机器人控制系统的离散状态空间模型:式中t和k分别代表采样时间和批次,批次过程的运行周期为T,且在每个重复过程周期t∈[0,T]内,取Nd个采样点;uk(t)∈Rl,yk(t)∈Rm和xk(t)∈Rn分别是所述移动机器人控制系统第k批次t时刻的l维输入、m维输出和n个状态向量;A,B,C为式(2)对应的离散系统参数矩阵,且满足CB≠0;并且假设系统运行的初始状态在围绕期望初始状态xd(0)的小范围内随机变化,其数学期望满足E{xk(0)}=xd(0);

第三步、利用随机变量建立批次长度随机变化模型:

针对式(3)形式的线性离散系统,将其状态空间表达式转换为时间序列的输入输出矩阵模型:yk=Guk+dk                    (4)其中:

uk=[uk(0),uk(1),...,uk(Nd-1)]Tyk=[yk(1),yk(2),...,yk(Nd)]TG是时间序列上的输入输出传递矩阵,dk是系统初始状态对输出的影响;输入Hilbert空间 和输出Hilbert空间 分别由如下内积及相关的诱导范数定义:其中, 分别为输入输出Hilbert空间上的向量,权矩阵R和Q为适当维数的实正定矩阵;

并且,定义期望输出yd∈l2[0,Nd]为:

yd=[yd(1) yd(2)…yd(Nd)]T              (7)传统的迭代学习控制要求批次长度固定为预期长度Nd,然而实际的运行批次长度在不同批次之间可能随机变化;记第k次迭代实际批次长度为Nk,定义实际批次长度的最小值与最大值分别为Nm和Nh;实际情况下一般将预期长度Nd设定为最大长度,即Nd=Nh;那么实际批次长度Nk在{Nm,Nm+1,…,Nd}内随机变动,即至多存在τm=Nd-Nm+1个运行批次长度;为了描述批次长度的随机性,令批次长度为Nm,Nm+1,…,Nd的概率分别为 其中pi>0,1≤i≤τm,且当实际批次长度Nk小于预期长度Nd时,第k批次的输出yk在时刻t∈[Nk+1,Nd]是缺失的,不能被用于输入的更新;将缺失时刻的跟踪误差简单地设置为零,从而转化成常规情况;那么得到修正后的跟踪误差为:修正后的跟踪误差序列为:

当Nk<Nd时,ek≠yd-yk,于是引入如下随机矩阵Mk来消除该不等关系:其中 表示Nk×Nk维的单位矩阵、Im表示m×m维的单位矩阵、 表示(Nd-Nk)×(Nd-Nk)维的零矩阵, 表示克罗内克积,于是修正后的跟踪误差序列表示为:对于多输出系统,当其中一个输出出现提前终止的情况,其它的输出也应同时终止,即使其它输出并未终止,其产生的输出也失去了学习的价值;例如,所述移动机器人在预设轨迹上移动时,遇到障碍提前停止,所述线速度变为零,但所述位姿角仍在变化,然而位姿角之后的输出值失去了迭代学习的价值,因此在刻画多输出系统随机矩阵的数学期望时,可以看做各输出具有相同的数学期望;

为了计算所述随机矩阵Mk的数学期望,引入伯努利二元随机变量γk(t)来表示第k批次时刻t输出是否存在;记第k批次时刻t输出存在的概率为p(t),则有:由于E{γk(t)}=P{γk(t)=1}×1+P{γk(t)=0}×0=p(t),则所述随机矩阵Mk的数学期望计算如下:其中,用 来简单表示随机矩阵的期望;

第四步、设计批次长度可变的迭代学习轨迹跟踪优化算法:将批次长度随机变化的离散状态空间模型(3)作为批次长度随机变化系统,给定任意初始输入及对应的跟踪误差,通过如下定义的输入信号:得到的输入序列{uk}k≥0能够迭代地解决批次长度随机变化下的跟踪问题,其中,M为某一批次的随机矩阵,其定义与式(10)相同,输入信号控制律的前馈形式通过求解如下定义的第一性能指标函数得到:将式(11)和式(4)先后代入所述第一性能指标函数(15),求其二次型最优解,得:其中 根据系统初始状态的假设E{xk(0)}=xd(0)可知:E{dk-dk+1}=0            (17)将式(17)代入式(16)得:

由于对于第k+1批次的输入,第k批次的输入信号和跟踪误差已知,其期望等于其本身,又由于 可逆,将式(18)整理后得到控制律为:uk+1=uk+Lek            (19)其中 是误差项的学习增益;

第五步、分析所述批次长度可变的迭代学习轨迹跟踪优化算法的收敛性:鉴于批次长度随机变化系统迭代学习优化算法的特殊性,引入逐次投影思想对算法进行收敛性分析;批次长度随机变化下轨迹跟踪问题的设计目标是迭代地找到一个最优控制输入 使得跟踪误差的期望收敛到零,这等价于迭代地在Hilbert空间中两个凸集S1和S2的交集中寻找点 集合S1和集合S2定义如下:S1={(e,u)∈H:e=E{M(yd-y)},y=Gu+d}    (20)S2={(e,u)∈H:e=0}                     (21)其中,所述集合S1表示系统动态,所述集合S2表示跟踪需求;假设所述集合S1和S2在Hilbert空间中存在交集,即 Hilbert空间H定义如下:Hilbert空间H包括跟踪误差及输入信号,其内积和相关的诱导范数由式(5)和式(6)导出:其中, 分别为输入输出Hilbert空间上的向量;

定义投影算子如下:

其中,x为Hilbert空间H上的一个点,PS(x)表示x在集合S上的投影;

对于x=(0,u)∈S2,其在S1上的投影为:

优化问题(26)的解为 其中 那么:

对投影算子 采取相似的运算,对于 有:

优化问题(28)的解取 于是:

根据逐次投影思想,使用 及xk=(0,uk)分别表示对集合S1和S2第k次投影后的点,给定一个初始点x0=(0,u0)∈S2,通过所述控制律(19)进行连续投影能够得到沿迭代轴更新的输入序列{uk}k≥0;

设所述集合S1和S2交于一点 即 由于所述集合S1和S2均为Hilbert空间中的有限维闭凸集,根据逐次投影引理知,序列 和{xk}k≥0均收敛于即:由式(30)得:

第k+1次输入如式(14)所示,

根据所述第一性能指标函数式(15),对于其非最优解uk有:由式(33)得:

E{||ek+1||}≤E{||ek||}          (33)即期望意义下的误差范数E{||ek||}单调收敛至零;

另外,为了得到所述权矩阵Q和R的选取范围,将控制律的前馈形式(19)代入式(33),并全部替换为与ek相关的形式,得:其中, 为单位矩阵,由于每个批次的误差ek均不相同,为了选取一组对任意批次误差均满足式(34)的所述权矩阵Q和R,需要得到一个约束条件;对式(34)两边取范数后,得其一个必要条件:将式(35)整理得到所述权矩阵Q和R应满足的约束条件为:第六步、在输入约束下设计批次长度可变的迭代学习轨迹跟踪优化算法:在许多工业过程控制应用中,为了确保工业过程安全、顺利地运行,需要对输入变量施加一定的约束,输入约束集Ω通常为凸集;所述输入约束集Ω一般有如下几种形式:控制器输入的饱和约束:

Ω={u∈l2[0,Nd]:|u(t)|≤Z(t),0≤t≤Nd}          (37)其中Z(t)≥0,0≤t≤Nd是随时间变化的输入幅值约束;

控制器输入的能量约束:

其中Z>0是输入总能量约束;

控制器输入的震荡约束:

Ω={u∈l2[0,Nd]:|Δu(t)|≤Z(t),1≤t≤Nd}             (39)其中Δu(t)=u(t)-u(t-1),Z(t)≥0,0≤t≤Nd是随时间变化的执行器输入震荡约束;

当出于实际需要对输入信号进行约束时,直接求取输入约束下的二次规划QP问题是困难的,于是根据逐次投影的思想设计在实际应用中更易实现的算法;

对于所述批次长度随机变化系统,给定任意满足约束的初始输入及对应的跟踪误差,先通过无约束控制律的前馈形式(19)得到输入信号再将其投影到所述输入约束集Ω:

从而得到满足输入约束的输入序列{uk∈Ω}k≥0能够迭代地解决批次长度随机变化下的跟踪问题;由于在实践中输入约束通常是逐点约束,因而需计算出优化问题(41)的解;当所述输入约束为饱和约束形式(37)时,对于t∈[0,Nd],优化问题(41)的解直接由如下形式给出:第七步、分析所述输入约束下的批次长度可变的迭代学习轨迹跟踪优化算法的收敛性:仍然采用所述逐次投影思想对所述输入约束下的批次长度随机变化优化算法进行收敛性分析;重新定义集合S1和S2如下:S1={(e,u)∈H:e=E{M(yd-y)},y=Gu+d}         (43)S2={(e,u)∈H:e=0,u∈Ω}                       (44)与第五步证明类似,对于x=(0,u)∈S2,其在S1上的投影为:其中 是根据所述无约束控制律的前馈形式(19)得到的;

对于 其在S2上的投影 有:

S2中的 和 是相互独立的,也就是说可以分开进行求解,于是:其中

根据所述逐次投影思想,使用 及xk=(0,uk)分别表示对集合S1和S2第k次投影后的点,给定一个初始点x0=(0,u0)∈S2,通过式(40)和式(41)进行连续投影能够得到沿迭代轴更新的输入序列{uk}k≥0;

当存在所述输入约束时,集合S1和S2可能不存在交集,所以对所述输入约束下的批次长度随机变化优化算法进行收敛性分析时,需要考虑 和 两种情况;

针对输入约束情况,先定义第二性能指标函数:

当 时,仍然得到式(30)和式(31);

xk与集合S1的最小距离为:

根据优化迭代学习控制律的前馈形式(19),得式(49)的优化解为:u*=uk+Lek                     (50)将式(50)代入到式(49)中,得:

同理有:

根据逐次投影引理的内容,每次投影后的抽象距离均单调减小,得到:即所述第二性能指标函数 是单调收敛的;

当 时,首先定义 是两集合S1和S2取最小距离时线段的两个端点,同时这也是如下优化问题的解:

式(54)等价于:

那么输入约束下的最优解为:

根据所述优化迭代学习控制律的前馈形式(19)可知,式(56)内部的最小化问题的最优解为:将式(57)代入到式(56)中,得:

式(58)中ek前的权重I-MkGL和L均是可逆的,那么需要最小化的性能指标是严格凸的,且所述输入约束集Ω也是凸的,因此该最小化问题具有唯一解,由此可得:其中,a是一个正常数,dd由期望初始状态导出:

由式(59)得知,误差范数的期望有界收敛;

根据 情况下所述第二性能指标函数 单调收敛的证明,同理可证明情况下所述第二性能指标函数 单调收敛;

第八步、实现批次长度可变的移动机器人控制系统在有输入约束情形下的轨迹跟踪:根据所述优化迭代学习控制律确定移动机器人系统每一迭代批次的输入矢量,将得到的输入矢量输入批次长度变化的移动机器人系统进行轨迹跟踪控制,移动机器人系统在批次长度变化情况下受到输入矢量的控制作用追踪期望输出。