1.一种基于形状因素调整的交通轨迹聚类相似性计算方法,其特征在于,包括以下步骤:步骤一:数据采集与数据预处理
采集多辆出租车轨迹数据,并进行预处理;
步骤二:时间区域划分
基于出行轨迹时间,将预处理后的轨迹数据集划分为不同集合,得到多个基于时间段的轨迹数据集;
步骤三:计算点—段距离
对基于时间段的轨迹数据集进行计算,得到点—段距离;
步骤四:优化点—段距离;
步骤五:根据优化后的点—段距离,计算段—段距离;
步骤六:根据段—段距离,计算相似性;
步骤三的具体过程如下:
首先通过公式(1)计算坐标rmid1(xmid1,ymid1)与坐标rmid2(xmid2,ymid2):其中,xmid1为点rmid1的经度,ymid1为点rmid1的纬度;xmid2为点rmid2的经度,ymid2为点rmid2的纬度;
ri‑1,ri,ri+1是轨迹R中连续的3个轨迹点,rmid1、rmid2分别是原子轨迹段ri‑1ri、riri+1的中点;
通过公式(2)计算轨迹点sj到轨迹点ri投影轨迹段的单向点—段距离distst(sj,ri);
同理计算轨迹点ri到轨迹点sj投影轨迹段的单向点—段距离distst(ri,sj);最后通过公式(3)将轨迹点ri与轨迹点sj之间的欧式距离经点—段距离转化为两个点之间的总的点—段距离distsd(ri,sj);
distsd(ri,sj)=distst(ri,sj)+distst(sj,ri) (3);
步骤四的具体过程如下:对点—段距离distsd进行优化,得到优化后的点—段距离distp,如公式(5)所示:
公式(5)中,θ1为轨迹点ri的轨迹点夹角,θ2为轨迹点sj的轨迹点夹角,θ为预先设定的角度预值,min(distsd‑1)为distsd(ri‑1,sj),distsd(ri,sj‑1),distsd(ri‑1,sj‑1)三个点到点距离中的最小值,min(distsd+1)为distsd(ri+1,sj),distsd(ri,sj+1),distsd(ri+1,sj+1)三个点到点距离中的最小值;
步骤五的具体过程如下:
轨迹序列R={r1,r2,...,ri,...,rn},S={s1,s2,...,sj,...,sm},子轨迹段riri+1与子轨迹段sjsj+1之间的距离为这两条子轨迹段的段—段距离distd(Ri,Sj),由公式(6)计算;
distd(Ri,Sj)=distp(ri,sj)+distp(ri+1,sj+1) (6)distp(ri,sj)为轨迹点ri到轨迹点sj投影轨迹段优化后的点—段距离,distp(ri+1,sj+1)为轨迹点ri+1到轨迹点sj+1投影轨迹段优化后的点—段距离;
两条子轨迹段的夹角ω如公式(7)所示:
ω=|arctan2(yi+1‑yi,xi+1‑xi)‑arctan2(yj+1‑yj,xj+1‑xj)| (7)对公式(6)进行优化,得到最终的段—段距离dists(Ri,Sj),如公式(8)所示;
dists(Ri,Sj)=f(ω)distd(Ri,Sj) (8)上式中函数f(ω)由公式(9)给出:
其中,ω是两条子轨迹段的夹角,δ是形状调节因子,lmin为对应的两段子轨迹段中较短的一条,lmax为对应的两段子轨迹段中较长的一条;
步骤六的具体过程如下:根据DTW算法,利用段—段距离,计算轨迹序列R、轨迹序列S的累积距离DTW(R,S),如公式(10)所示:其中,n是轨迹序列R上的原子轨迹段数目,m是轨迹序列S上的原子轨迹段数目,Head(R)表示轨迹序列R上的第一个原子轨迹段R1,Head(S)表示轨迹S上的第一个原子轨迹段S1,Rest(R)表示轨迹序列R去除了第一个原子轨迹段后的轨迹。