1.一种改进的基于欧式距离的相似度匹配方法,将所提取的轨迹点进行时间维度上的划分,每个时间段内的特征点进行特征提取,在考虑时间维度以及保留数据特征的情况下,降低相似度比较过程中的数据量;所述的方法包括:步骤1,获取移动数据;利用现有移动数据,每条数据均为主基站接收的信号数据,保留包括IMSI、StartTime、LocLng以及LocLat字段作为移动定位过程中的必要信息,其中,IMSI表示个体携带的移动设备的唯一标识符,StartTime为基站接收到移动信号的即时时间,LocLng以及LocLat为接收基站的经纬度,即基站的地理位置;
步骤2,获取原始轨迹;根据IMSI查询,即可获得特定时间段内该IMSI对应移动设备的若干条移动数据,每条移动数据即为该移动设备移动轨迹的一个轨迹点,其中,轨迹点信息包括该点的位置坐标 以及采样时间t;按照轨迹点的即时时间排序,即可构成个体的运动轨迹;
步骤3,分时段特征点采样;以一定的时间区间为单位,将特定时间段划分为若干个时间区间,将采集得到的移动轨迹的轨迹点按照其即时时间,放入每个区间,这样每个时间区间内会有若干按时间排序的轨迹点;在单个时间区间内,通过这些轨迹点的位置坐标可得轨迹经过的位置点(Lngj,Latj),即时时间差可得到个体在某位置点停留的时间Δtj,将位置停留时间作为计算特征点位置的权重条件,按照如下公式计算;
注:wtj表示位置j在计算特征点时该轨迹点位置的权重,Δtj表示在位置j停留的时间,tTotal表示单个时间区间的总时间;
由每个位置点的权重wtj,得到可以代表该个体在该时间区间的综合位置,如以下公式所示;
注:rix以及riy表示在该时间区间i内特征点的总位置经纬度,该时间区间内的总轨迹点数为m,Lngj以及Latj在该时间区间内经过位置点j的经纬度;
经过以上计算,即可得到特定时间段内轨迹的运动位置情况;
步骤4,相似度计算;根据不同的筛选对象,给这些时间区间赋予不同的权值wpi,权值取值范围:1≤wpi≤2;例如,需要筛选家庭成员,则给予夜间时间区间以较高的权值;需要筛选一起工作学习的团体,则给予日间时间区间以较高的权值;选取某个IMSI,作为待匹配对象,得到轨迹R,与库中的各轨迹S进行加权的欧氏距离计算,如下公式所示;
注:R,S分别为两条轨迹,两条轨迹的轨迹点数分别为n,E(R,S)为轨迹R与S间的欧式距离,ri,si分别表示轨迹R与S上第i个轨迹点,rix与riy表示ri的位置坐标,six与siy表示si的位置坐标,wpi为相应时间区间的权值,distance(ri,si)表示ri,si间的欧式距离;
步骤5,给出相似度排序表;根据计算得到的欧氏距离,取出距离最小的5条轨迹,作为与之相似度最高的轨迹集。