1.一种基于网联车辆自然驾驶数据的异常驾驶场景提取方法,其特征在于,包括:步骤一、对网联车辆自然驾驶数据集进行数据清洗,填补缺失数据,计算出横向加速度;
步骤二、将速度划分为若干区间,对速度区间内的纵向加速度和步骤一得到的横向加速度进行异常加速度提取,根据某段行程的异常加速度点数量,判断是否属于极端驾驶事件;
步骤三、利用找出的极端驾驶事件数据采用k-means聚类算法进行聚类;
步骤四、将聚类结果通过经纬度定位在google earth中得到驾驶场景并统计驾驶参数。
2.根据权利要求1所述基于网联车辆自然驾驶数据的异常驾驶场景提取方法,其特征在于:所述的步骤一数据清洗时当时间连续的10条数据中出现5条以上缺失值时,认为是不可信数据,将其删除;并筛选出超过5s的连续时间序列数据;数据的采集频率为10HZ。
3.根据权利要求1所述基于网联车辆自然驾驶数据的异常驾驶场景提取方法,其特征在于,所述的步骤一采用临位均值插补的方式对缺失值进行补充,具体计算方式如下:式中,Xi为缺失数据,{Xi-k+…+Xi-1+Xi+1+Xi+k}为缺失数据前后的正常数据,k为采取填补的单侧长度,取k=5,即为1s内的10条数据进行补充。
4.根据权利要求1所述基于网联车辆自然驾驶数据的异常驾驶场景提取方法,其特征在于,步骤一使用网联车辆自然驾驶数据中的车道线距离计算出横向速度,再得出横向加速度;
具体的计算方式如下:
式中,di和di+1分别是i和i+1时刻检测到的右侧车道线距离,Δt是时间采样时间间隔,vi是计算得到的i时刻的瞬时横向速度,ai是计算得到的i时刻的瞬时横向加速度。
5.根据权利要求1所述基于网联车辆自然驾驶数据的异常驾驶场景提取方法,其特征在于,所述的步骤二以0.1m/s为区间将速度划分为若干区间,对每个速度区间内的加速度采取置信度95%对纵向加速度和横向加速度进行异常加速度提取,如果同一段行程出现连续5个以上的异常加速度点时,则将此段行程认为是一个极端驾驶事件。
6.根据权利要求1所述基于网联车辆自然驾驶数据的异常驾驶场景提取方法,其特征在于,所述步骤三对极端驾驶事件数据进行聚类的具体步骤如下:步骤3-1、特征选取,选取能够表示车辆空间和时间的特征信息进行聚类;
特征矩阵的表达式如下:
在上述表达式中,Di表示i时刻车辆的时间和空间特征, 表示i时刻车辆的相对横向距离, 表示i时刻车辆的相对纵向距离, 表示i时刻车辆的相对横向速度, 表示i时刻车辆的相对纵向速度,ai表示i时刻主车辆的横向加速度;
步骤3-2、使用轮廓系数法确定聚类簇数k,根据步骤3-1选出的特征矩阵进行k均值聚类;令k从2到某个固定值,计算k的轮廓系数,选取轮廓系数最大值的k作为分类个数;
轮廓系数计算方法为:
式中,a(i)表示i向量到同一簇内其他样本的平均距离,a(i)越小则此向量越应该被聚类到该簇;b(i)表示i向量到其它簇的所有样本的平均距离,b(i)越大说明向量i不属于其它簇;
空间中数据对象与聚类中心间的欧氏距离计算公式:
其中,x为数据对象;Ci为第i个聚类中心;m为数据对象的维度;
xj,Cij分别为x和Ci的第j个属性值;
整个数据集的误差平方和计算公式为:
其中,SSE的大小表示聚类结果的好坏;当SSE的值没有变化时,聚类结束。
7.根据权利要求1所述基于网联车辆自然驾驶数据的异常驾驶场景提取方法,其特征在于,所述的步骤3-1中,使用主车辆和目标车辆的相对距离、相对速度和主车辆加速度信息组成特征矩阵;所述的主车辆为采集数据的车辆,所述的目标车辆为相邻车辆。