1.一种考虑执行器故障的机械臂分散最优容错控制方法,该方法为:构建执行器故障下基于关节力矩传感器反馈技术的模块化机械臂系统子关节模型,设计龙博格状态观测器估计未知执行器故障,基于关节力矩传感器测得的信息建立综合近似的未知执行器故障、跟踪性能、控制器输出的改进代价函数,利用评价神经网络结构近似最优容错控制器,优化系统跟踪性能的同时减少控制力矩的输出,最终得到分散近似最优控制器;最后,在不同的执行器故障下,通过不同构形的模块化机械臂进行实验探究验证了该方法的有效性;
所述方法包括以下步骤:
步骤一,考虑未知执行器故障下,基于关节力矩反馈技术的n自由度模块化机械臂系统动力学模型表示为:其中,qi为第i个关节位置; 为关节角速度; 为关节角加速度;Imi为电机转动惯量;
γi为减速器的减速比; 关节间的动力学耦合交联项, 为包括所有关节的位置、速度、加速度的信息;τfi为关节力矩传感器所测得的力矩信息;τi为电机输出力矩;
为第i个关节的执行器故障函数,βi(ti‑TFi)=[0,ti<TFi or
1,ti≥TFi]为阶跃函数且βi为阶跃函数的参数,ti为模块化机械臂运行时刻;TFi为子关节系统发生执行器故障的时间,为故障函数,0≤ρFi≤1为故障有效因子; 为摩擦力矩项,将定义为一类与关节位置和关节速度有关的函数:其中,fci为库伦摩擦相关参数;fsi为静摩擦相关参数;fτi为位置依赖型摩擦及摩擦建模误差;bfi为待定常数; 为非参数化摩擦项;此外,符号函数 被定义为:考虑到总摩擦力矩 主要包括谐波减速器中的柔轮之间摩擦和各关节模块执行电机中的摩擦;所建立的摩擦力矩项的模型(2)是有效且经过实验验证得到的,可将其中的名义系数fbi,fci,fsi,fτi看作与实际值十分接近;因此,根据线性化准则,将关节所受摩擦项有以下方程估计:其中, 为由摩擦各项估计误差组成的近似误
差向量, 分别为对应摩擦系数fbi,fci,fsi,fτi的估计值,由与关节位置和关节速
度有关的函数组成的向量;
通过上述推导简化整理得知,针对一个n‑DOF模块化机械臂系统发生未知执行器故障时,将其第i个关节的动力学模型表示为以下非线性系统的状态空间形式:其中, 为模块化机械臂的状态向量表示关节运动角位置和角速度状态, 为系统状态对时间的微分形式,yi为模块化机械臂系统的输出,Di=+(Imiγi)‑1∈R为转动惯量项,ui=τi为第i个关节的控制力矩及执行器输入力矩,Γfi为已知模型项和Θi为模型不确定项包括摩擦力矩模型的建模误差和近似误差,以及关节间的动力学耦合交联项,分别表示为:步骤二,为了建立自适应龙博格故障观测器,将模块化机械臂关节子系统(5),表示为以下形式:其中,
其中,Bi,βi(xi),Ci,Oi为与系统跟动力学信息相关的参数矩阵;通过设计自适应龙博格故障观测器来实时近似未知的执行器故障:其中, 为模块化机械臂关节子系统状态xi的观测值,Ki为观测器给定的正增益, 为模块化机械臂关节子系统输出yi的观测值, 为近似的执行器故障;定义观测器观测误差EFi为:根据观测器稳定性证明和近似未知故障的准确性,将近似的执行器故障的更新控制律设计为:T
其中,近似故障的更新律αFi=[α1i α2i] 且α1i,α2i为相对应的更新律参数,矩阵Λi为控制参数矩阵,可以由求解以下Riccati方程得到:T
(Bi‑KiOi) Λi+Λi(Bi‑KiOi)=‑XFi (13)其中,XFi为一个给定的对称正定矩阵;
步骤三,定义关节模块位置跟踪误差和速度跟踪误差分别为:ei=xi‑xid (14)其中,ei和为模块化机械臂的位置跟踪误差和速度跟踪误差,xid和 为期望的即任务目标的机械臂关节运动位置和运动速度;为了更好的实现跟踪目标,设计综合关节模块位置信息和速度信息的滑模函数mi(t)为:其中,kei为控制器所设定的参数;
为了实现发生未知执行故障下的模块化机械臂容错控制目标,将跟踪目标和估计的故障以控制指标的形式放入代价函数中,从而找到最优容错控制策略;因此,建立含有近似执行器故障的代价函数Ji(mi(t)):T T
其中,效应函数Ni(mi(t),ui(mi(t)))=mi(t) Qimi(t)+ui(t)Riui(t),对于所有mi(t)和ui(t)有不等式Ni(mi(t),ui(mi(t)))≥0成立,并且初始状态Ni(0,0)=0,矩阵Qi和Ri为给定的正数,ρFi,ρyi和ρui为给定的控制器参数, 为由自适应龙博格观测器近似的未知执行器故障,Γfi为模块化机械臂可测的模型动力学信息,Gi为模型不确定项Θi的上界参数,且满足不等式 存在;Ψi(Ω)是由一系列可行的控制策略Ω组成的集合;
为求解模块化机械臂分散最优容错控制问题,将相对应的哈密尔顿‑雅可比‑贝尔曼函数 和最优代价函数 定义如下:其中, 为代价函数Ji(mi)对mi的偏微分函数, 表示与速度跟踪误差和期望角加速度相关的函数;利用上述哈密尔顿‑雅可比‑贝尔曼函数和最优代价函数,结合优化思想,最优代价函数 满足于哈密尔顿‑雅可比‑贝尔曼函数:如果 存在且连续可微,可以得到考虑未知执行器故障的模块化机械臂系统分散最优容错控制策略为:
并通过整理和推导可以得到等式:
步骤四,利用策略迭代算法来寻找最优控制策略,它借助于动态规划基本方程,交替使用“求值计算”和“策略改进”两个步骤,求出逐次改进的、最终达到或收敛于最优控制策略,策略迭代算法由策略评估和策略改进两部分组成,具体步骤如下:步骤2:当j>0时,结合控制策略 通过以下的等式来更新代价函数这里代价函数
步骤3:通过以下等式来更新控制策略
步骤4:如果 停止计算,得到最优控制策略;否则,令j=j+1,转到步骤2;
步骤5:停止;
通过该算法的迭代计算 ,当j→∞时可以近似计算出最优代价函数和最优控制策略
步骤五,为了找到最优控制策略,需要求解哈密尔顿‑雅可比‑贝尔曼函数得到最优代价函数,然后将解结合策略迭代算法得到最优控制策略;利用神经网络的逼近能力来近似得到最优代价函数,从而才能通过策略迭代算法找到最优控制策略;
建立评价神经网络结构近似相对应的最优代价函数:
N
其中, 是理想权值,Ni为隐含层神经元的个数,δic(mi)∈R是激活函数,εic为评价神经网络近似残差;将代价函数Ji(mi)的偏导数表示为:其中, 和 分别为激活函数和评价神经网络近似残差的偏导数;并得到名义上的分散最优容错控制策略为:
根据名义上的神经网络建立,哈密尔顿‑雅可比‑贝尔曼函数改写为:其中,eich为由理想的评价神经网络近似哈密尔顿‑雅可比‑贝尔曼函数得到的残差;
由于理想的评价神经网络权值Wic无法直接得知,所以将评价神经网络近似为:其中, 为神经网络权值的近似值;从而,得到近似分散最优容错控制策略 为:进而,得到近似的哈密尔顿‑雅可比‑贝尔曼函数为:其中,ec是估计的哈密尔顿‑雅可比‑贝尔曼函数的近似误差,通过采用梯度下降算法最小化目标函数 以调整神经网络权值向量 设计其更新策略为:其中,αc为评价神经网络权值的更新学习律;
因此,针对发生未知执行器故障的模块化机械臂系统,结合最优控制策略和评价神经网络近似能力,利用策略迭代算法,最终得到近似的分散最优容错控制策略为: