1.一种基于博弈论的自动驾驶车辆换道冲突协调模型建立方法,其特征在于:包括如下步骤:
步骤一、在LV产生换道意图时判断是否需要博弈:如果是,则进入步骤二;若否,则判断换道条件是否满足:若是,则进入步骤十,若否,则进入步骤十一;
其中,所述判断是否需要博弈的条件包括:LV与PV保持安全距离且LV与PV的冲突时间差不超过设定的阈值,其中:
(1)LV与PV的安全距离采用如下公式计算:式中,Gl为换道车辆LV与当前车道前车PV的安全距离,xl(t)为t时刻换道车辆LV位置,xp(t)为t时刻当前车道前车PV位置,lp为当前车道前车PV的车身长度,bp和bl是车辆PV和LV各自的最大刹车加速度,τl为LV的反应时间,vl(t)为t时刻LV的速度,vp(t)为t时刻PV的速度;
(2)LV与PV的冲突时间差的计算方法为:
1)按如下公式计算LV从换道起点到达潜在冲突点过程中行驶的距离:式中,Ll为LV从当前位置换道至潜在冲突点的行驶距离,x和y为车辆LV车头左端的横向和纵向位置,xe和ye分别为换道轨迹终点的横向和纵向坐标;
2)按如下公式计算RV从当前位置行驶到潜在冲突点的距离:Lr=xc+d
式中,xc为潜在冲突点的横坐标,Lr表示RV从当前位置到潜在冲突点的行驶距离,d表示LV与RV在纵向上的车头间距;
3)
式中,vr(t)和vl(t)分别表示RV和LV当前t时刻的速度;
其中:
所述潜在冲突点的位置采用如下方法确定:a)计算潜在冲突点的纵坐标yc:yc=ye‑wcar
其中,ye为换道轨迹曲线终点的纵坐标,wcar表示车辆宽度;
b)建立换道轨迹方程:
c)将yc的值带入换道轨迹曲线方程即可求解出xc,最后获得潜在冲突点的位置(xc,yc);
步骤二、确定LV和RV的收益函数,包括速度收益、安全收益和舒适性收益,其中:(1)速度收益:
1)LV不换道策略下的速度收益为:其中, 表示LV在不换道策略下的速度收益,vp(t)表示PV在t时刻的速度,vl(t)表示LV在t时刻的速度;
2)LV换道策略下的速度收益为:其中, 表示LV在换道策略下的速度收益,vf(t)表示FV在t时刻的速度,vl(t)表示LV在t时刻的速度;
3)RV避让策略下的速度收益为:其中, 表示FV避让策略下的速度收益, 表示RV的预期避让速度,通过下式求得:式中,TM表示安全临界点,Tl(t)表示LV从当前位置执行换道到达潜在冲突点的行驶时间,按如下公式得到:
其中,vl(t)表示LV在换道时刻t的速度,al(t)表示LV在换道时刻t选择的加速度;Ll表示LV在预测换道执行轨迹上与潜在冲突点的距离;
4)RV不避让策略下的速度收益为:(2)舒适性收益:
1)LV的舒适性收益为: 其中,al(t‑λ)表示上一步长LV的加速度;
2)PV的舒适性收益为: 其中,ar(t)表示RV在换道时刻t选择的加速度,ar(t‑λ)表示上一步长RV的加速度;
(3)安全收益:
1)LV选择换道策略下LV和RV的安全收益表达式为:其中, 表示在LV换道策略下RV的安全收益, 表示在LV换道策略下LV的安全收益,ΔT表示车辆LV和RV的冲突时间差;
2)LV选择不换道策略
当LV选择不换道策略时,两车辆不存在冲突关系,没有安全隐患,因此RV和LV的安全性都不会有损失,此外,两辆车的安全收益都为0;
步骤三、计算LV和RV的收益矩阵:(1)在策略组合S11={LV换道,RV避让}下,LV和RV的总收益为:其中, 和 分别表示LV和RV在策略组合S11下的总收益,fvel(*)、fsafe(*)、fcom(*)分别表示速度收益值、安全收益值、舒适性收益值归一化后的结果,α1,β1,γ1表示LV在速度收益、安全收益和舒适性收益之间权重参数,α2,β2,γ2表示RV在速度收益、安全收益和舒适性收益之间权重参数,三者之和为1;
(2)在策略组合S12={LV换道,RV不避让}下,LV和RV的总收益为:其中, 和 分别表示LV和RV在策略组合S12下的总收益;
(3)在策略组合S21={LV不换道,RV避让}下,LV和RV的总收益为:其中, 和 分别表示LV和RV在策略组合S21下的总收益;
(4)在策略组合S22={LV不换道,RV不避让}下,LV和RV的总收益为:其中, 和 表示LV和RV在策略组合S22下的总收益;
步骤四、计算LV和RV在各策略下的加速度:(1)LV在换道策略下的加速度:其中,hf(t)代表t时刻LV与FV的车头时距,hr(t)代表t时刻LV与RV的车头时距, 代表t时刻驾驶员期望的FV与LV的车头时距, 代表t时刻驾驶员期望的RV与LV的车头时距,k表示换道车辆在总加速度中对目标车道前车的考虑程度,a1,b1,c1,a2,b2,c2是参数;
(2)LV在不换道策略下的加速度:其中,τ是反应时间, 是LV车辆相对车辆PV的纵向安全速度,按下列公式计算得到:
式中,xl(t)是t时刻换道车辆LV的纵向位置,xp(t)是t时刻前车PV的纵向位置;
(3)RV选择避让策略时的最优避让加速度:其中, 和 分别表示在S11和S21下RV车辆的最优避让加速度, 和 分别表示RV在策略组合S11和S21下的总收益,br表示RV的最大减速度, 表示RV车辆的避让加速度;
(4)RV在不避让策略下的加速度:其中, 是RV车辆相对车辆FV的纵向安全速度,按如下公式计算得到:式中,bf是车辆FV的最大减速度,xr(t)是t时刻换道车辆RV的纵向位置,vr(t)是t时刻换道车辆RV的速度,xf(t)是t时刻前车FV的纵向位置,lcar表示PV车辆长度;
步骤五、通过收益矩阵求解出纳什均衡解,然后判断是否存在纳什均衡唯一解:若是,则输出该唯一解,然后进入步骤六;若否,则选择两车总收益之和的最大解作为输出,然后进入步骤六;
步骤六、判断输出是否是{换道,避让}或者{不换道,不避让}:若是,则进入步骤七;若否,则策略改进,然后进入步骤七;
步骤七、输出最终策略;
步骤八、判断LV是否要换道:若是,则进入步骤九;若否,则LV在原车道继续跟驰,然后进入步骤十一;
步骤九、判断是否满足换道条件:若是,则进入步骤十;若否,则LV和RV更新加速度后返回步骤九;
步骤十、LV进行换道;
步骤十一、本次换道意图结束。
2.根据权利要求1所述的基于博弈论的自动驾驶车辆换道冲突协调模型建立方法,其特征在于:步骤六所述策略改进的方法为:当 时,将解{换道,不避让}改进为{换道,避让},当 时,将解{换道,不避让}改进为{不换道,不避让},其中:θ表示在换道博弈过程中,RV可以接受的收益降低的最大值。
3.根据权利要求1所述的基于博弈论的自动驾驶车辆换道冲突协调模型建立方法,其特征在于:步骤六所述策略改进的方法为:当最终解为{不换道,避让}时,将最终解直接改进为{不换道,不避让}。