1.一种基于手机信令数据的出行方式识别方法,其特征在于,具体包括以下步骤:步骤1,获取手机信令数据;基于手机信令数据中的用户经纬度与时间切片信息,获取用户单次出行的起点及终点的POI点要素,获取用户单次出行的中间段轨迹;获取用户所处城市的位置信息;
步骤2,基于用户的起点及终点的POI点要素与中间段轨迹,获得拟合后的出行轨迹;基于拟合后的出行轨迹,获得用户单次出行距离和出行时间,计算得到用户单次出行的平均速度;
步骤3,获取用户所处城市高峰时段及平峰时段各出行方式的速度阈值范围和距离阈值范围;基于城市公交运营线路网生成缓冲区,所述缓冲区用于获取所述拟合后的出行轨迹在城市公交运营线路上的轨迹点;基于拟合后的出行轨迹以及缓冲区,获得出行轨迹与城市公交运营线路网的重合率;基于用户单次出行距离和出行时间以及所处城市的位置信息,判断获得用户的出行时间处于高峰时段还是平峰时段;
步骤4,基于预设的阈值条件对用户出行方式进行一次判别,得到一次判别结果则出行方式识别完成,否则跳转执行步骤5;其中,一次判别的阈值条件为用户出行距离、平均速度、出行时段和出行轨迹与城市公交运营线路网的重合率;
步骤5,对于在一次判别的阈值条件之外的问题数据进行二次判别,包括:基于步骤2获得的拟合后的出行轨迹的OD点经纬度,得到问题数据的出行OD距离;对问题数据进行二次判别,获得二次判别结果,完成出行方式识别;其中,二次判别的阈值条件为用户出行距离、平均速度、OD距离、出行轨迹与城市公交运营线路网的重合率。
2.根据权利要求1所述的一种基于手机信令数据的出行方式识别方法,其特征在于,步骤1中,所述手机信令数据来自智慧足迹极智平台的联通手机信令数据,包括:单次出行起终点的经纬度,单次出行轨迹中每个路径节点经纬度、顺序与编号,出行开始时间,出行结束时间。
3.根据权利要求2所述的一种基于手机信令数据的出行方式识别方法,其特征在于,步骤2中,所述手机信令数据中,地铁出行方式具有单独的出行字段;筛除用户单次地铁出行样本,获得待识别出行方式的数据库。
4.根据权利要求1所述的一种基于手机信令数据的出行方式识别方法,其特征在于,步骤2中,基于用户的起点及终点的POI点要素与中间段轨迹,获得拟合后的出行轨迹的具体步骤包括:
将用户首段轨迹、尾段轨迹与中间段轨迹拟合相连,得到拟合后的出行轨迹;
其中,所述中间段轨迹为用户使用手机且信号与基站交互,通过基站位置与城市路网拟合的结果;所述首段轨迹为用户的起点的POI点要素与中间段轨迹起始点POI点要素相连的结果,所述尾段轨迹为用户的终点的POI点要素与中间段轨迹结束点POI点要素相连的结果;对首段轨迹和尾段轨迹距离之和大于等于1km的数据进行清洗。
5.根据权利要求1所述的一种基于手机信令数据的出行方式识别方法,其特征在于,步骤3中,根据百度开放平台轻量级路线规划数据,得到城市高峰时段及平峰时段各出行方式的速度阈值范围;对于出行距离,使用K‑means无监督学习进行分类,以分类结果作为参照,得到城市各交通方式出行的距离阈值范围。
6.根据权利要求1所述的一种基于手机信令数据的出行方式识别方法,其特征在于,步骤3中,基于拟合后的出行轨迹以及缓冲区,获得出行轨迹与城市公交运营线路网的重合率的具体步骤包括:
(1)利用形成的缓冲区,选取单次出行轨迹在缓冲区内的轨迹点数据,形成单次出行轨迹与城市公交运营线路网的重合轨迹数据;
(2)将得出的重合轨迹数据与单次出行轨迹数据相比,得到单次出行轨迹与城市公交运营线路网的重合率。
7.根据权利要求1所述的一种基于手机信令数据的出行方式识别方法,其特征在于,步骤4中,一次判别的具体步骤包括:
对公交车出行方式进行判别包括:阈值条件有公交车速度阈值范围、公交车距离阈值范围、出行时段、轨迹与城市公交运营线路网重合率范围;其中,公交车速度阈值取值包括:在出行时段为平峰时段时公交车速度阈值范围,在出行时段为高峰时段时公交车速度阈值取值范围;落在公交车的各阈值范围内则此次出行为公交车出行方式;
对步行出行方式进行判别包括:阈值条件有步行速度阈值范围、步行距离阈值范围;落在步行的各阈值范围内则此次出行为步行出行方式;
对自行车出行方式进行判别包括:阈值条件有自行车速度阈值范围、自行车距离阈值范围;落在自行车的各阈值范围内则为自行车出行方式。
8.根据权利要求7所述的一种基于手机信令数据的出行方式识别方法,其特征在于,步骤4中,一次判别的具体步骤还包括:根据对公交车出行方式的判别结果,对在公交车出行阈值区间内的私家车进行判别,阈值条件有私家车速度阈值范围、私家车距离阈值范围、出行时段范围、轨迹与城市公交运营线路网重合率范围;其中,私家车速度阈值范围包括:在出行时段为平峰时段时的私家车速度阈值范围和在出行时段为高峰时段时的私家车速度阈值范围;落在私家车的各阈值范围内则为此次出行为私家车出行方式;
对在公交车出行阈值区间外的私家车进行判别,阈值条件有私家车速度阈值范围、私家车距离阈值范围;其中,私家车速度阈值范围包括:在出行时段为平峰时段时的私家车速度阈值范围和在出行时段为高峰时段时的私家车速度阈值范围;落在私家车的各阈值范围内则为私家车出行方式;
对摩托车出行方式进行判别,包括:阈值条件有摩托车速度阈值范围和摩托车距离阈值范围;落在摩托车的各阈值范围内则为摩托车出行方式。
9.根据权利要求8所述的一种基于手机信令数据的出行方式识别方法,其特征在于,步骤5中,二次判别的具体步骤包括:
对步行进行二次判别,阈值条件有步行距离阈值范围、步行OD距离阈值范围;落在步行的各二次判别阈值范围内则此次出行为步行出行方式;
对自行车进行二次判别,阈值条件有自行车距离阈值范围、自行车OD距离阈值范围;落在自行车的各二次判别阈值范围内则此次出行为自行车出行方式;
对公交车进行二次判别,阈值条件有公交车速度阈值范围、公交车距离阈值范围、公交车OD距离阈值范围、轨迹与城市公交运营线路网重合率范围;落在公交车的各二次判别阈值范围内则此次出行为公交车出行方式;
对私家车进行二次判别,包括:根据公交车二次判别结果,对在公交车出行阈值区间内的私家车进行判别,阈值条件有私家车速度阈值范围、私家车距离阈值范围、私家车OD距离阈值范围、轨迹与城市公交运营线路网重合率;对在公交车出行阈值区间外的私家车进行判别,阈值条件有私家车OD距离阈值范围、私家车距离阈值范围;落在私家车的各二次判别阈值范围内则此次出行为私家车出行方式。