1.快速路交通系统的迭代动态线性化及自学习控制方法,其特征在于,包括以下步骤:(1)建立快速路交通系统的空间离散交通模型;
(2)将所述空间离散交通流模型用一般非线性离散时间系统的形式表示;
(3)将一般非线性离散时间模型转化为动态线性化数据模型;
(4)建立迭代动态线性化数据模型的学习控制律和参数更新律。
2.根据权利要求1所述的快速路交通系统的迭代动态线性化及自学习控制方法,其特征在于,所述步骤(1)中所述快速路交通系统包括一条单车道的快速路,每一区段均有一个入口匝道和一个出口匝道,则所述快速路的空间离散交通流模型为:qi(t)=ρi(t)vi(t), (2)
其中,h是采样时间间隔;t是指第t个时刻,t∈{0,1,∧,T};i∈{1,∧,IN}是指快速路的第i个区段;IN是总的区段数;τ,v,k,l,m为常数参数;ρi(t)表示快速路第i个区段第t个时刻的交通流密度;vi(t)表示快速路第i个区段第t个时刻的平均速度;qi(t)表示快速路第i个区段第t个时刻的交通流量;ri(t)表示快速路第i个区段第t个时刻的入口匝道交通流率;si(t)表示快速路第i个区段第t个时刻的出口匝道交通流率;Li表示快速路第i个区段的长度,Vfree表示快速路第i个区段的自由速度,ρjam表示最大密度。
3.根据权利要求2所述的快速路交通系统的迭代动态线性化及自学习控制方法,其特征在于,将所述空间离散交通流模型转化为一般非线性离散时间形式为:y(t+1)=f[y(t),r(t),d(t)], (5)其中,状态向量y(t)∈Rn包括所有交通密度、平均速度以及匝道序列;控制向量r(t)∈Rn包括所有可控匝道流率;干扰向量d(t)∈Rn包括所有入口匝道的需求和转弯速度;f(Λ)∈Rn是向量值函数。
4.根据权利要求3所述的快速路交通系统的迭代动态线性化及自学习控制方法,其特征在于,所述步骤(3)中将非线性数据模型转化为动态线性化数据模型,需要设定非线性数据模型满足以下2个假设:假设1:f(Λ)关于控制向量r(t)的偏导数连续;
假设2:非线性数据模型满足广义Lipschitz条件,即对任意固定的t和‖Δr(t)‖≠0,有其中,Δy(t+1)=y(t+1)-y(t),Δr(t+1)=r(t)-r(t-1); 是一个正常数;
则可得,对于任意的时刻t一定存在一个被称为PPD矩阵的参数 使得非线性数据模型能够转化为以下等价的动态线性化数据模型,其中, 且
5.根据权利要求4所述的快速路交通系统的迭代动态线性化及自学习控制方法,其特征在于,所述步骤(5)中建立动态线性化数据模型的学习控制律和参数更新律的步骤为:(51)设定动态线性化数据模型满足假设3,同时设定快速路交通系统在有限的运行时间间隔t内重复, 是严格重复的;
假设3:PPD参数矩阵 是正定或者非负定;
(52)设置期望交通输出为yd,k(t)∈Rn,对于所有的t∈{0,1,∧,T},k=1,2,∧,yd,k(t)是迭代相关且有界的,即其中,byd为正常数且存在;
(53)定义跟踪误差ek(t)=yd,k(t)-yk(t),则ek(t+1)=yd,k(t+1)-yk(t)-Φ(t)Δrk(t)=Φ(t)(Φ(t)-1yd,k(t+1)-Φ(t)-1yk(t)-Δrk(t)) (9)令
ek(t+1)=Φ(t)[Θ(t)ζk(t)-Δrk(t)] (10)n -1 n×n
其中,ζk(t)=yd,k(t+1)-yk(t)∈R,Θ(t)=Φ(t) ∈R ;
(54)则可得第k次的学习控制律可表述为:
其中, 是Θ(t)的估计值,它的参数更新律为
其中, 是给定有界的;c>0;0<abΦ<2,P=In×n是单位阵。