1.一种基于协同演化的自动驾驶车辆决策涌现方法,包括以下步骤:构建道路模型,并确定车辆在道路模型中的初始位置分布和行驶目的地;
对于车辆集群设置多目标优化问题,以控制车辆的多个行驶指标为优化目标;
设置多个候选驾驶策略用于限定车辆的行驶速度以及前车与后车的交互关系,并根据所述多个候选驾驶策略将车辆划分到不同的种群;
根据车辆运动学模型、预设的交通信号灯调度策略以及车辆对应的候选驾驶策略运行车辆;
基于所述优化目标,探索所述多个候选驾驶策略的优劣;
其中,在探索所述多个候选驾驶策略的优劣的过程中,采用以下奖励函数评估车辆k:其中:
r(k)表示第k辆车的奖励函数;
η表示第k辆车引起的事故数量;
Tk表示第k辆车的生命周期;
表示第k辆车的速度;
δv表示所有车辆的速度的标准差;
β1,β2表示各项权重;
表示第k辆车t时刻的速率;
Δt表示时间步长;
其中,在探索所述多个候选驾驶策略的优劣的过程中,后代的繁衍规则设置为:当车辆得分落在平均值右侧或区域右侧的两个标准偏差邻域内时,繁殖两个后代;
当车辆得分落在平均值右侧的标准偏差邻域内时,繁殖两个后代;
车辆得分落在平均值的左侧时,不繁殖后代;
其中,将所述优化目标设置为:使得:
f1(x)=∑i∑jgi,j(t)*gi,j+1(t)f2(x)=‑E(v(t))αk,t=αk,t‑1+θk,tvk,t≤vmax
θk,t≤θmax
其中:
表示第k辆车t时刻的速率;
vk,t表示第k辆车t时刻的速率;
αk,t表示第k辆车t时刻的车姿角度;
θk,t表示第k辆车t时刻的方向盘转角;
表示第k辆车t时刻的加速度;
Δt表示时间步长;
||·||表示二范数;
amax表示最大加速度;
vmax表示最大速度;
θmax表示最大方向盘转角;
gi,j(t)表示路网中第i行第j列的栅格在t时刻的占用状态;
ck,t表示第k辆车在t时刻的几何中心;
f2(x)=‑E(v(t))表示所有车辆的总体平均速度。
2.根据权利要求1所述的基于协同演化的自动驾驶车辆决策涌现方法,其特征在于,所述构建道路模型,并设置车辆在道路模型中的初始位置分布和行驶目的地包括:构建带交叉口的双向四车道道路模型,其中道路由栅格组成,每个栅格都是一个矩形,栅格长度被设置为等于车辆长度;
将随机设置车辆的初始分布并随机设置车辆目的地,当车辆中心点落入道路模型的网格中时,认为网格被占据。
3.根据权利要求1所述的基于协同演化的自动驾驶车辆决策涌现方法,其特征在于,所述多个候选驾驶策略包括:保守策略:用于限定车辆以最大速度行驶,当前车的速度较慢时减速,不要超车;
理性策略:用于限定以最大的速度行驶,当前车的速度较慢并且变道相关20米区域内没有车辆汇入时超车;
贪婪策略:用于限定以最高速度行驶,始终超车。
4.根据权利要求1所述的基于协同演化的自动驾驶车辆决策涌现方法,其特征在于,所述交通信号灯调度策略是固定时间片轮转,每个时间片为8秒。
5.根据权利要求1所述的基于协同演化的自动驾驶车辆决策涌现方法,其特征在于,所述多个行驶指标包括平均通行时间、事故率,平均排放、平均能耗中的至少两项。
6.一种计算机可读存储介质,其上存储有计算机程序,其中,该程序被处理器执行时实现根据权利要求1至5中任一项所述方法的步骤。
7.一种计算机设备,包括存储器和处理器,在所述存储器上存储有能够在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至5中任一项所述的方法的步骤。