1.一种连续搅拌釜反应器催化剂补料最优控制系统,其特征在于:包括设置于连续搅拌釜反应器(21)内的反应物浓度传感器(22-1)和催化剂浓度传感器(22-2),分别采集反应物浓度和催化剂浓度;以及采集反应器温度的温度传感器(22-3);反应物浓度、催化剂浓度和反应器温度由模数转换器(23)转换为数字信号,该数字信号经现场总线网络(24)输入分散控制系统(25),分散控制系统(25)根据控制变量参数化最优控制方法获得使催化剂浓度、反应物浓度和温度分别与设定值偏差最小的同时催化剂和冷却剂使用量最少的催化剂输入量、冷却剂输入量最佳控制策略,并将最佳控制策略转换为催化剂控制阀门、冷却剂控制阀门的开度指令,然后通过现场总线网络(24)发送给数模转换器(27),数模转换器(27)将开度指令转换为模拟信号后控制催化剂控制阀门(28-1)和冷却剂控制阀门(28-2)动作;
主控室状态显示模块(26)显示分散控制系统(25)获得的催化剂浓度、反应物浓度、温度以及最佳控制策略。
2.根据权利要求1所述一种连续搅拌釜反应器催化剂补料最优控制系统,其特征在于:
所述分散控制系统(25)包括:信息采集模块(31),用于获取连续搅拌釜反应器反应过程微分方程,反应物浓度、催化剂浓度、连续搅拌釜反应器温度、催化剂阀门开度限制、冷却剂阀门开度限制、生产时间范围;
初始化模块(32)用于设置生产过程时间分段数为N,其对应的控制网格为T(k),设置催化剂、冷却剂阀门开度的初始猜测值u(k)(t0),设定计算精度tol,将迭代次数k置零;
TDDE求解模块(34),用于获取本次迭代下带延迟时间系统中催化剂浓度、反应物浓度和反应器温度的状态信息x(k)(t)和目标函数值J(k);
灵敏度轨迹梯度求解模块(35),用于获取本次迭代目标函数梯度信息dJ(k);
NLP问题求解模块(36)用于进行收敛性判断,如果本次迭代的目标函数值J(k)与上一次迭代的目标函数值J(k-1)的绝对值之差小于精度tol,则判断收敛性满足,并将本次迭代的催化剂和冷却剂的输入量转换为催化剂和冷却剂阀门开度的控制指令由控制指令输出模块(37)输出。
3.利用权利要求1或2所述控制系统进行连续搅拌釜反应器催化剂补料最优控制的方法,包括以下步骤:步骤一:输入连续搅拌釜反应器反应过程微分方程,设定生产时间范围、催化剂控制阀门开度限制、冷却剂控制阀门开度限制;
步骤二:反应物浓度传感器(22-1)、催化剂浓度传感器(22-2)和温度传感器(22-3)分别采集反应物浓度、催化剂浓度和反应器温度经过模数转换器(23)后用现场总线网络(24)回送给分散控制系统(25),并在主控室状态显示模块(26)上显示;
步骤三:分散控制系统(25)根据控制变量参数化最优控制算法,获得使催化剂浓度、反应物浓度和温度与设定值偏差最小的同时催化剂和冷却剂使用量最少的催化剂输入量、冷却剂输入量最佳控制策略;
步骤四:分散控制系统(25)将最佳控制策略转换为催化剂控制阀门、冷却剂控制阀门的开度指令,通过现场总线网络(24)发送给数模转换器(27),使催化剂控制阀门(28-1)和冷却剂控制阀门(28-2)根据收到的开度指令执行相应动作。
4.根据权利要求3所述连续搅拌釜反应器催化剂补料最优控制的方法,其特征在于:步骤三所述控制变量参数化最优控制算法具体包括以下步骤:步骤1):信息采集模块(31)获取连续搅拌釜反应器反应过程微分方程,反应物浓度、催化剂浓度、连续搅拌釜反应器温度、催化剂阀门开度限制、冷却剂阀门开度限制、生产时间范围;
步骤2):初始化模块(32)根据信息采集模块(31)采集的数据计算稳定生产要求下当前反应物浓度、催化剂浓度和连续搅拌釜反应器温度与设定值偏差,设置催化剂阀门开度、冷却剂阀门开度、生产时间区间参数,采用分段常量参数化,设置生产过程时间分段数为N,其对应的控制网格为T(k),设置催化剂、冷却剂阀门开度的初始猜测值u(k)(t0),设定NLP问题的计算精度tol,将迭代次数k置零;
步骤3):TDDE求解模块(34)获取本次迭代下带延迟时间系统中催化剂浓度、反应物浓度和反应器温度的状态信息x(k)(t)和目标函数值J(k);
步骤4):通过灵敏度轨迹梯度求解模块(35)获取本次迭代目标函数梯度信息dJ(k);当k=0时跳过步骤5)和步骤6),直接执行步骤7);
步骤5):NLP问题求解模块(36)进行收敛性判断,如果本次迭代的目标函数值J(k)与上一次迭代的目标函数值J(k-1)的绝对值之差小于精度tol,则判断收敛性满足,并将本次迭代的催化剂和冷却剂的输入量转换为催化剂和冷却剂阀门开度的控制指令输出;如果收敛性不满足,则继续执行步骤6);
步骤6):用u(k)(t),J(k),dJ(k)的值覆盖上一次迭代u(k-1)(t),J(k-1),dJ(k-1)的值,并将迭代次数k加1;
步骤7):NLP问题求解模块(36)利用在步骤3)和步骤4)中获得的目标函数值和梯度信息,求解寻优方向和寻优步长,并进行寻优修正,获得比u(k-1)(t)更优的新的催化剂和冷却剂阀门开度控制策略u(k)(t);该步骤执行完成后再次跳转至步骤3),直至NLP收敛性判断模块满足为止。
5.根据权利要求4所述连续搅拌釜反应器催化剂补料最优控制的方法,其特征在于:所述步骤3)中具体采用扩展二级三阶龙格库塔方法,求解公式为:K1=f[u(k)(ti),u(k)(ti-s),x(k)(ti),S(k)(ti-r),ti]K2=f[u(k)(ti),u(k)(ti-s),x(k)(ti)+K1h/2,S(k)(ti-r),ti+h/2]K3=f[u(k),u(k)(ti-s),x(k)(ti)-hK1+2K2h,S(k)(ti-r),ti+h]x(k)(ti+h)=x(k)(ti)+h(K1+4K2+K3)/6
其中,f(·)是描述连续搅拌釜反应器反应过程微分方程的函数,ti表示龙格库塔方法选择的积分节点,u(k)(ti)表示催化剂、冷却剂在第k次迭代中第ti积分节点的阀门开度控制量,u(k)(ti-s)表示第k次迭代中第ti积分节点带s时间延迟下催化剂、冷却剂的阀门开度控制量,x(k)(ti)表示搅拌釜反应器催化剂、反应物、反应器温度在第k次迭代中第ti积分节点(k)的状态信息,S (ti-r)表示搅拌釜反应器催化剂、反应物、反应器温度第k次迭代中第ti积分节点带r时间延迟下的状态信息,h表示积分步长,K1、K2、K3分别表示龙格库塔法积分过程中的3个积分节点ti、ti+h/2、ti+h下连续搅拌釜反应器反应过程微分方程的函数值。
6.根据权利要求4所述连续搅拌釜反应器催化剂补料最优控制的方法,其特征在于:所述灵敏度轨迹梯度求解模块(35)采用扩展灵敏度轨迹方程法为:(1)定义第k次迭代的扩展轨迹灵敏度方程如下:
Γ(k)(t)的求解公式为:
其中,t表示时间, 表示第k次迭代中扩展灵敏度轨迹方程对于t的导数,f(·)是描述搅拌釜反应器反应的状态微分方程函数,Γ(k)(t0)表示扩展灵敏度轨迹方程在第k次迭代时的初始节点状态值,x0表示状态微分方程函数的初始节点状态值,F(·)是描述灵敏度方程的函数;
(2)采用扩展二级三阶龙格库塔方法求解扩展灵敏度轨迹方程Γ(k)(t)在各积分时刻的值,求解公式为:Q1=F[u(k)(ti),u(k)(ti-s),x(k)(ti),S(k)(ti-r),ti](k) (k) (k) (k)
Q2=F[u (ti),u (ti-s),x (ti)+Q1h/2,S (ti-r),ti+h/2]Q3=F[u(k),u(k)(ti-s),x(k)(ti)-hQ1+2Q2h,S(k)(ti-r),ti+h]Γ(k)(ti+h)=Γ(k)(ti)+h(Q1+4Q2+Q3)/6
其中,ti表示龙格库塔方法选择的积分节点,u(k)(ti)表示催化剂、冷却剂在第k次迭代中第ti积分节点的阀门开度控制量,u(k)(ti-s)表示第k次迭代中第ti积分节点带s时间延迟下催化剂、冷却剂的阀门开度控制量,x(k)(ti)表示搅拌釜反应器催化剂、反应物、反应器温度在第k次迭代中第ti积分节点的状态信息,S(k)(ti-r)表示搅拌釜反应器催化剂、反应物、反应器温度第k次迭代中第ti积分节点带r时间延迟下的状态信息,F(·)是描述灵敏度方程的函数,h表示积分步长,K1、K2、K3分别表示龙格库塔法积分过程中的3个积分节点ti、ti+h/2、ti+h下灵敏度方程的函数值;
(3)根据得到的状态信息x(k)(t)和扩展灵敏度轨迹方程Γ(k)(t),求解目标函数的梯度信息dJ(k):其中,Φ(u(k)(t),x(k)(t),tf)表示连续搅拌釜反应器生产过程终止时刻目标函数,L(u(k)(t),u(k)(t-s),x(k)(t),S(k)(t-r),t)表示连续搅拌釜反应器生产过程的积分目标函数,N表示连续搅拌釜反应器生产过程时间分段数。
7.根据权利要求4所述连续搅拌釜反应器催化剂补料最优控制的方法,其特征在于:所述NLP问题求解采用如下步骤实现:步骤1):如果本次迭代的目标函数值J(k)与上一次迭代的目标函数值J(k-1)的绝对值之差小于精度tol,则判断收敛性满足,并将本次迭代的催化剂和冷却剂输入量控制策略转换为催化剂、冷却剂阀门的开度指令输出;如果收敛性不满足,则继续执行步骤2);
步骤2):用u(k)(t),J(k),dJ(k)的值覆盖上一次迭代u(k-1)(t),J(k-1),dJ(k-1)的值,并将迭代次数k增加1;
步骤3):将催化剂和冷却剂输入量控制策略u(k-1)(t)作为向量空间中的某个点,记作(k-1)P1,P1对应的目标函数值就是J ;
步骤4):从点P1出发,根据选用的NLP算法和点P1处的目标函数梯度信息dJ(k-1),构造向量空间中的一个寻优方向d(k-1)和步长α(k-1);
步骤5):通过式u(k)(t)=u(k-1)(t)+α(k-1)d(k-1)构造向量空间中对应u(k)(t)的另外一个点P2;
步骤6):采用寻优校正得到向量空间中对应u(k)(t)的另外一个点P3,使得P3对应的目标函数值J(k)比J(k-1)更优;进入步骤1)进行收敛性判断。