1.一种基于城市子区域热点路口挖掘的区域异常检测方法,其特征在于,包括:S10.获取历史一周内的城市区域路口数据源数据S和城市路网数据,得到路口集合 ;
所述路口数据源数据S,包括:路口车流量 和路口覆盖范围下的移动通信次数 ;所述城市路网数据,包括:城市区域划分信息、路口经纬度信息、路口类型;
S20.根据所述路口类型从所述路口集合 中得到可驾驶路口,根据所述历史一周内的城市区域路口车流量 计算所述可驾驶路口早上七点到九点的早高峰平均车流量,根据所述早高峰平均车流量将所述可驾驶路口降序排序,取前50%的所述可驾驶路口作为候选热点路口,将所述候选热点路口存入候选热点路口集合;
S30.计算所述候选热点路口集合中候选热点路口的中介中心度,将所述中介中心度大于阈值L的所述候选热点路口存入待检测路口集合;
S40.根据所述历史一周内的城市区域路口数据源数据S和城市路网数据计算所述待检测路口集合中所有待检测路口之间的相似度,得到相似路口矩阵;
S50.根据所述相似路口矩阵的第i个行向量找出第i个待检测路口的相似路口集合,i初始值为0;
S60.获取当前时间段的城市区域路口数据源数据和城市区域划分信息;
S70.根据所述当前时间段的城市区域路口数据源数据和所述第i个待检测路口的相似路口集合,采用LOF算法对所述第i个待检测路口进行异常检测,若所述第i个待检测路口为异常路口,将所述第i个待检测路口加入异常路口集合;判断所述第i个行向量是否为所述相似路口矩阵的最后一个行向量,若是,转S80,若否,i=i+1,转S50;
S80.在当前时间段根据所述城市区域划分信息将城市划分为多个城市子区域,根据所述路口经纬度信息将所述待检测路口集合中所有待检测路口映射到所述城市子区域,得到当前时间段每个所述城市子区域的子区域路口集合;
S90.在当前时间段根据所述异常路口集合找出所述子区域路口集合中的异常路口,若所述子区域路口集合中的异常路口总数大于或等于所述子区域路口集合中路口总数的
60%,则当前时间段所述城市子区域为异常区域;
步骤S70中,所述LOF算法的具体实现步骤如下:
1)因为路口车流量 和路口覆盖范围下的移动通信次数 在数据规模上存在较大差异,所以将当前时间段t的路口车流量 和路口覆盖范围下的移动通信次数 进行归一化,归一化计算公式如下:, ;
其中, 表示第个待检测路口的相似路口集合中的任意路口, 表示在当前时间段t路口 归一化后的路口车流量 , 表示在当前时间段t路口 的路口车流量 ,表示时间段 至时间段 内路口 的路口车流量 的最小值,表示时间段 至时间段 内路口 的路口车流量 的最大值;
表示在当前时间段t路口 归一化后的路口覆盖范围下的移动通信次数 , 表示在当前时间段t路口 的路口覆盖范围下的移动通信次数 , 表示时间段 至时间段 内路口 的路口覆盖范围下的移动通信次数 的最小值,表示时间段 至时间段 内路口 的路口覆盖范围下的移动通信次数 的最大值;
2)根据归一化后的当前时间段t的路口车流量 和路口覆盖范围下的移动通信次数计算所述第i个待检测路口的相似路口集合中所有路口之间的欧式距离,并按距离升序排序,计算公式如下:;
其中, 表示所述第i个待检测路口的相似路口集合中与路口 不同的任意路口,表示所述第i个待检测路口的相似路口集合中路口 与路口 的欧氏距离;
3)根据城市区域内的路口数量设置k值,计算所述第i个待检测路口的相似路口集合中所有路口的第k个最近的路口的距离,得到任意路口 的k邻近距离 ,获取所述第i个待检测路口的相似路口集合中所有路口的邻居路口,得到任意路口 的邻居路口集合 ,所述邻居路口为距离任意路口 的距离小于路口 的k邻近距离的所有路口,计算任意路口 的邻居路口集合的大小为 ;
4)计算所述第i个待检测路口的相似路口集合中所有路口之间的可达距离,其计算公式如下:;
其中, 表示取路口 与 的欧氏距离和
路口 的k邻近距离 之间的最大值;
5)计算所述第i个待检测路口的相似路口集合中所有路口的局部可达密度 ,其计算公式如下:;
其中, 表示路口 的邻居路口集合 中的任意路口;
6)根据第i个待检测路口与其邻居路口的所述局部可达密度计算所述第i个待检测路口的局部异常因子,若所述第i个待检测路口的局部异常因子大于1,则所述第i个待检测路口为异常路口,局部异常因子计算公式如下:;
其中,表示所述第i个待检测路口, 表示所述第i个待检测路口的邻居路口集合中的任意路口, 表示所述第i个待检测路口的局部异常因子。