1.一种基于乘客需求重识别的长距离优先票额分配方法,其特征在于,所述方法包括以下步骤:
S1、获取目标列车的相关数据,并对目标列车的相关数据进行处理;
S2、建立余票更新机制;
S3、根据乘客购票行为及各等级列车席位的余票情况,将乘客的购票意愿分为确定性意愿和非确定性意愿,因此将乘客购票数据分为确定性意愿的乘客购票数据和非确定性意愿的乘客购票数据;
所述确定性意愿:在各等级列车席位的余票数量都能够满足乘客需求的情况下,若乘客选择购买其中一种等级列车席位的车票,则认定乘的购票行为与其潜在购票需求是一致的,此时通过乘客的购票行为能够确定乘客的潜在购票需求,将这种情况下的乘客购票意愿称为确定性意愿;
所述非确定性意愿:在不同等级列车席位中有一种以上等级列车席位的余票数量不能够满足乘客需求的情况下,若乘客选择购买其中一种等级列车席位余票数量能够满足乘客需求的车票,则认定乘客的购票行为与其潜在购票需求之间的关系是不确定的,此时通过乘客的购票行为无确定法乘客的潜在购票需求,将这种情况下的乘客购票意愿称为非确定性意愿;
S4、对经过步骤S1处理后的所述目标列车的相关数据进行特征提取,得到与列车席位等级相关性高的特征;
S5、基于所述确定性意愿的乘客购票数据构建用于识别乘客潜在购票需求的支持向量机模型;
S6、用所构建的用于识别乘客潜在购票需求的支持向量机模型对输入的每位乘客的购票数据进行分析并划分列车席位需求等级,进而识别出每位所述非确定性意愿的乘客的潜在购票需求;
S7、将目标列车运行的每个OD区间按照运行距离从长到短进行排序,并规定票额分配的优先级别为按照运行距离从长到短逐级递减;
S8、基于乘客的潜在购票需求数据并结合步骤S7所规定的票额分配的优先级别,对目标列车运行的每个OD区间进行票额分配;所述乘客的潜在购票需求数据是由所述确定性意愿的乘客和所述非确定性意愿的乘客的潜在购票需求数据组成。
2.根据权利要求1所述的一种基于乘客需求重识别的长距离优先票额分配方法,其特征在于,所述目标列车的相关数据包括:目标列车的发车日期,目标列车的席位等级分布,目标列车各等级席位的定员,目标列车运行的OD区间,目标列车运行的OD区间的距离,乘客购票提前天数,乘客的购票渠道,乘客所购车票的起点站,乘客所购车票的终点站,乘客所购车票的起点站和终点站所在城市的行政等级,乘客购票数量,乘客所购车票的席位等级。
3.根据权利要求1所述的一种基于乘客需求重识别的长距离优先票额分配方法,其特征在于,所述步骤S2,建立余票更新机制,具体包括:用c表示目标列车席位等级编号,i表示不同OD区间的起点站编号,j表示不同OD区间的终点站编号;用矩阵 描述目标列车运行在OD区间(i,j)的c等级列车席位的余票数量;用表示乘客购买起点站为i、终点站为j,且列车席位等级为c的车票数量;设置各等级列车席位的余票数量的初始值为目标列车对应等级席位的定员;当发生乘客购票行为并且购票行为成立时,所涉及的列车运行的OD区间对应等级的列车席位的余票数量立即更新,具体步骤包括:
S2‑1、初始化矩阵
S2‑2、乘客要购买 张车票,若 则售卖出满足乘客需求的车票给乘客,此时乘客的购票行为成立;若 则拒绝售卖车票给乘客,此时乘客的购票行为不成立;
S2‑3、一旦发生售票行为,立即更新矩阵S2‑4、判断更新后的矩阵 若 则返回步骤S2‑2继续执行,否则终止售票。
4.根据权利要求1所述的一种基于乘客需求重识别的长距离优先票额分配方法,其特征在于,所述步骤S4,对经过步骤S1处理后的所述目标列车的相关数据进行特征提取,得到与列车席位等级相关性高的特征,具体包括:判断列车席位等级与其余特征之间的关系,并分别计算出列车席位等级与任一其余特征之间的相关系数,依据计算出的相关系数提取与列车席位等级相关性高的特征;所述其余特征是指不包括列车席位等级在内的经过步骤S1处理后的所述目标列车的相关数据;
计算相关系数的公式为:
公式中,rm表示列车席位等级与任一其余特征之间的相关系数;n表示样本容量,k≤n;y表示列车席位等级;xm表示任一其余特征。
5.根据权利要求1所述的一种基于乘客需求重识别的长距离优先票额分配方法,其特征在于,所述步骤S5和所述步骤S6,具体包括:定义已购票乘客样本数据集、训练集、测试集,如下:所述已购票乘客样本数据集是由所述确定性意愿的乘客购票数据和所述非确定性意愿的乘客购票数据共同组成,记为
所述训练集是由所述确定性意愿的乘客购票数据组成,记为S,用于进行数据分析并构建用于识别乘客潜在购票需求的支持向量机模型;
所述测试集是由所述非确定性意愿的乘客购票数据组成,记为T,用于测试所构建的用于识别乘客潜在购票需求的支持向量机模型在实际应用中的预测表现情况,同时识别出每位所述非确定性意愿的乘客的潜在购票需求;
令 其中N表示乘客提前购买的车票总数;
令 其中, 为任一子训练集,表示第h次购票信息对应的数据; 表示第h次购票的属性特征,且 yh表示对应属性条件下实际购票的列车席位等级的标签,且yh∈{0,1},其中数值0和1代表两种不同的列车席位等级;h=1,2,…,l;l代表子训练集的总量;
因此,
采用所述训练集构造特征空间中的超平面:基于所述训练集获得的信息,根据列车席位等级种类将特征空间分为两种,用于描述所述超平面的函数表达式为f(x)=ωx+b,ω为所述超平面的法向量,b为所述超平面的一个变量;
基于所述训练集,求解得到ω和b的最优解可以用于解决如下优化问题:
0≤αs≤C,s=1,2,…,l,T
式中,α=(α1,α2,…,αl)是拉格朗日乘子向量;K是内核函数;C是手动设置的惩罚因子;
Xs和Xt是任一两个子训练集的输入,ys和yt分别是对应的两个子训练集的标签,ys∈{0,1},yt∈{0,1};
基于上述优化问题求解得到ω和b的最优解,分别用 和 表示,如下:非线性分类器函数的表达式为
6.根据权利要求1或4所述的一种基于乘客需求重识别的长距离优先票额分配方法,其特征在于,所述与列车席位等级相关性高的特征包括:目标列车运行的OD区间,目标列车运行的OD区间的距离,乘客购票提前天数,乘客所购车票的起点站,乘客所购车票的终点站,乘客所购车票的起点站和终点站所在城市的行政等级。
7.根据权利要求1所述的一种基于乘客需求重识别的长距离优先票额分配方法,其特征在于,所述步骤S8,基于乘客的潜在购票需求数据并结合步骤S7所规定的票额分配的优先级别,对目标列车运行的每个OD区间进行票额分配,具体包括:假定在目标列车运行的同一OD区间内,除无座以外的各等级列车席位的票价逐级递减,且一等级列车席位的票价高于其他等级列车席位的票价,无座的票价不高于其他等级列车席位的票价;
S8‑1、对潜在购票需求为一等级列车席位的乘客按照步骤S7所规定的票额分配的优先级别进行票额分配;若潜在购票需求为一等级列车席位的乘客需求量超出目标列车一等级列车席位的定员,则将超出部分的潜在购票需求为一等级列车席位的乘客需求视为潜在购票需求为次等级列车席位;
S8‑2、对潜在购票需求为次等级列车席位以及视为潜在购票需求为次等级列车席位的乘客按照步骤S7所规定的票额分配的优先级别进行票额分配;若潜在购票需求为次等级列车席位以及视为潜在购票需求为次等级列车席位的乘客需求量超出目标列车次等级列车席位的定员,则将超出部分的潜在购票需求为次等级列车席位以及视为潜在购票需求为次等级列车席位的乘客需求视为潜在购票需求为次等级列车席位的下一等级列车席位;
S8‑3、按照步骤S8‑2的分配规律依次对除无座以外的各等级列车席位存在潜在购票需求的乘客进行票额分配;
S8‑4、对除无座以外的各等级列车席位存在潜在购票需求的乘客进行票额分配完成后,若还存在乘客的潜在购票需求没有被满足,则潜在购票需求没有被满足的这部分乘客只能选择购买该次目标列车的无座车票。
8.根据权利要求7所述的一种基于乘客需求重识别的长距离优先票额分配方法,其特征在于,所述步骤S8的票额分配过程中还包括步骤:对目标列车运行的每个OD区间设置各等级列车席位的票额分配最小阈值;当存在任一OD区间的任一等级列车席位的乘客需求量没有达到该OD区间该等级列车席位的票额分配最小阈值时,该OD区间没有被分配的该等级列车席位将分配给比该OD区间距离长且包含该OD区间在内的其余长距离OD区间。