1.一种基于大数据技术的多模式公交客流推算方法,其特征在于,所述方法基于IC卡数据集、GPS数据集、站点线路基础数据集,推导乘客的上车站点;通过分析单个乘客的出行链特征,对换乘行为进行分析从而重构完整的出行链;基于出行特征,采用单条刷卡记录对应下车点的非集计推导获得出行链的最终下车点;结合上车点和出行链的最终下车点得到涵盖公交和地铁的一体化公共交通站间OD矩阵,对所述OD矩阵进行扩样处理得到完整的公共交通客流分布。
2.根据权利要求1所述一种基于大数据技术的多模式公交客流推算方法,其特征在于,所述站点线路基础数据集包括地铁终端数据集、地铁站点线路数据集、公交线路站点数据集、站点序号数据集;
所述IC卡数据集包括:刷卡时间、地铁终端编号或公交车辆编号、IC卡号和用于标识地铁和公交的刷卡类型;所述GPS数据集包括:GPS点采样时刻时间、车辆编号、运行线路、瞬时经度和瞬时维度。
3.根据权利要求2所述一种基于大数据技术的多模式公交客流推算方法,其特征在于,所述方法具体包括:
上车站点推导:基于IC卡数据集、GPS数据集、站点线路基础数据集,根据公交和地铁的特点,将公交上车站点和地铁上车站点分别进行推导;
出行链重构:根据乘客出行中是否有换乘行为,将刷卡记录进行整合,重构乘客出行链,即将没有换乘行为的单条记录直接视为一条出行链,将有换乘行为的多条记录进行结合后视为一条出行链;重构后出行链包括:乘客当日仅有一次刷卡数据无换乘行为时对应的单条刷卡记录构成的出行链;乘客当日有多次刷卡数据且有换乘点时对应的多条刷卡记录合并重构的出行链;乘客当日有多次刷卡数据对应的闭合公共交通出行链,所述闭合公共交通出行链包括通勤类常发性出行和偶发性出行两种类型;
最终下车点推导:根据出行特征,将下车点分为:换乘点、闭合强出行点和闭合弱出行点;所述换乘点在出行链重构后即可得到;所述闭合强出行点和所述闭合弱出行点用于表示非换乘点的下车点;所述闭合强出行点对应通勤类常发性出行,表示乘客经常出行的地点,能够根据多天的刷卡记录得到;所述闭合弱出行点对应偶发性出行,表示表示乘客偶发出行的地点,能够通过分析前后刷卡记录特征得到;根据所述闭合强出行点和所述闭合弱出行点进一步推导获得出行链的最终下车点;
站间客流OD矩阵生成:将提取出的各出行链的上车点和出行链的最终下车点,导入Excel数据表中,运用数据透视功能得到涵盖公交和地铁的一体化公共交通站间客流OD矩阵;
对所述站间客流OD矩阵进行扩样处理:针对IC卡数据集中某些刷卡记录不能够顺利匹配到公交下车站点的情况,以及针对通过纸币完成缴费出行的群体,分别采用不同的系数进行扩样。
4.根据权利要求3所述一种基于大数据技术的多模式公交客流推算方法,其特征在于,在所述上车站点推导的步骤中:地铁上车站点的推导方法为:刷卡时IC卡数据集记录了地铁终端编号,通过地铁终端编号将IC卡数据集和地铁终端数据集中的地铁终端编号进行匹配,地铁终端数据集中还包括和地铁编号对应的站点名称,进而获得乘坐地铁时的上车站点;
公交上车站点的推导方法:包括车辆编号匹配、时间匹配、最近站点搜索三步;首先通过IC卡数据集获得乘客乘坐的公交车车辆编号,然后将IC卡数据集中刷卡时间和乘客乘坐车辆的GPS数据集中的GPS时刻均转化为分钟并进行对比,寻找GPS数据集中与刷卡时间相同或者最接近的采样时刻,最后基于该采样时刻点下的位置坐标确定运行线路上距离最近的公交站点,即为乘坐公交时的上车站点。
5.根据权利要求3所述一种基于大数据技术的多模式公交客流推算方法,其特征在于,所述出行链重构的步骤为:对乘客刷卡记录进行排序后,通过判断两条相邻记录中上下车点的距离间隔和时间间隔是否满足阈值来确定是否存在换乘行为,小于阈值即认为存在换乘行为;将有换乘行为的多条记录进行结合后视为一条出行链,将没有换乘行为的单条记录直接视为一条出行链。
6.根据权利要求3或5所述一种基于大数据技术的多模式公交客流推算方法,其特征在于,出行链重构步骤,具体为:步骤一:根据IC卡卡号和刷卡时间对所有刷卡记录进行排序,提取第一条刷卡记录作为当前研究记录,进行判断;
步骤二:判断当前研究记录与下一条记录是否属于同一卡号,若属于,进入步骤三;若不属于,判断当前记录是否已和上一记录合并成一条出行链,若没有,则将当前记录视为一条单独的出行链,之后将下一条记录视为当前研究记录,重新进入步骤二;
步骤三:判断当前研究记录的刷卡类型是公交还是地铁;
对于公交:计算下一记录上车点与当前线路所有站点的距离,判断最小的距离值是否小于阈值,若不满足,则将当前研究记录作为单独出行链,进入步骤四;若小于阈值,获取当前线路站点中距离下一记录上车点距离最小的一个站点,记为当前线路距离最小站点;并通过车辆的GPS数据集寻找与所述当前线路距离最小站点距离最近的采样点,将对应的时刻视为车辆到达所述当前线路距离最小站点的时刻,进而计算下一记录上车点时刻与车辆到达所述当前线路距离最小站点的时刻的差值,判断差值是否小于阈值,若不小于,将当前研究记录作为单独出行链,进入步骤四;否则将当前研究记录与下一记录合并,并将获取的所述当前线路距离最小站点标记为当前研究记录的下车点,记为换乘点,进入步骤四;
对于地铁:直接计算下一记录上车点和当前研究记录下车点的时刻之差和距离间隔,分别与时间阈值和距离阈值进行比较,若都小于阈值,则将当前研究记录与下一记录合并,并将当前记录的下车点标记为换乘点,进入步骤四,否则将当前研究记录视为单独出行链后进入步骤四;
步骤四:判断下一条记录是否为整个IC卡数据集中的最后一条记录,若不满足条件,则将下一条记录视为当前研究记录,返回步骤二,否则进一步判断当前记录和下一记录是否合并,若已合并,则直接结束整个流程,若未合并,则将下一记录视为单独出行链后结束整个流程。
7.根据权利要求3所述一种基于大数据技术的多模式公交客流推算方法,其特征在于,在所述下车点推导的步骤中,根据所述闭合强出行点和所述闭合弱出行点进一步推导出行链的最终下车点的步骤,具体为:步骤一:提取所述出行链重构的步骤中重构的出行链,将有换乘行为的下车点标记为换乘点;
步骤二:依次提取重构后单条出行链;
步骤三:针对单条出行链,提取出最后一条刷卡记录,如果是乘客当日仅有一次刷卡数据的单次出行则直接提取单条刷卡记录;
步骤四:基于闭合强出行点判断下车点:提取同一卡号多天的刷卡记录中的上车点,并按上车点出现次数由大到小依次排序,选取排序靠前的若干个上车站点作为闭合强出行点,并寻找最后一条刷卡记录所在线路中与所述闭合强出行点距离最近的线路站点,并计算所述闭合强出行点和与所述闭合强出行点距离最近的线路站点之间的距离,选取满足阈值且距离最近的线路站点作为出行链的最终下车点,进入步骤八;
若最后一条刷卡记录所在线路中的线路站点与若干个所述闭合强出行点的距离均不满足阈值要求,进入步骤五;
步骤五:判断是否存在卡号相同的下一条连续出行链记录,若存在,进入步骤六,若不存在,进入步骤七;
步骤六:基于闭合弱出行点判断下车点:提取下一条连续出行链记录中的上车点,即闭合弱出行点,寻找当前刷卡记录所在线路中与所述闭合弱出行点距离最近的线路站点,并计算所述闭合弱出行点和与所述闭合弱出行点距离最近的线路站点之间的距离;若距离满足阈值要求,将与所述闭合弱出行点距离最近的线路站点作为出行链的最终下车点,进入步骤八;若不满足,进入步骤七;
步骤七:由于信息资源的不足无法准确获得真正的下车点,该步骤不作操作;
步骤八:提取下一条出行链,进入步骤三,直至所有的出行链判断完成,结束。
8.根据权利要求3所述一种基于大数据技术的多模式公交客流推算方法,其特征在于,对所述站间OD矩阵进行扩样处理包括:针对IC卡数据集中某些刷卡记录不能够顺利匹配到公交下车站点的情况,采用第一扩样系数,表达式如下:
式中, 为线路i的第一类扩样系数;Ti为IC卡数据集中线路i的刷卡数据总量;Si为线路i已推导出的公交出行OD矩阵的刷卡数据总量,即在推导下车点的过程中,通过车辆编号识别线路i的刷卡记录,计算采用所述最终下车点推导步骤推导得出最终下车点的线路i刷卡记录的总量;
针对通过纸币完成缴费出行的群体,采用第二扩样系数进行扩样;第二扩样系数表达式如下:
式中, 为线路i的第二类扩样系数;Ui为线路i利用纸币和IC卡刷卡缴费出行的全部出行次数总量;Mi为线路i的纸币票款收入所对应的出行次数总量。