1.一种基于历史商家记录及用户行为的电商消费客流量预测方法,其特征在于,包括以下步骤:
101、获取待预测商家的历史电商消费记录及用户的浏览消费记录,并进行数据预处理操作得到商家历史流量数据;
102、然后对进行预处理后的商家历史流量数据集进行分析并将影响商家流量的因素分解,建立一种加权时间序列的回归模型;
103、最后预测未来每天通过电商消费的客流量。
2.根据权利要求1所述的基于历史商家记录及用户行为的电商消费客流量预测方法,其特征在于,所述步骤101获取需预测的商家最近n天的历史电商消费记录及用户的浏览消费记录,并进行数据预处理操作包括;
天气数据进行数值化处理,将天气的恶劣程度用数值表示;得到的数据为一天中的最高温,最低温,恶劣程度,PM2.5,记录中脏数据进行平滑处理;对某一项缺失数据用最近n天记录的均值进行填补。
3.根据权利要求2所述的基于历史商家记录及用户行为的电商消费客流量预测方法,其特征在于,所述n取值为30天。
4.根据权利要求2所述的基于历史商家记录及用户行为的电商消费客流量预测方法,其特征在于,所述步骤102对数据集进行分析提取添加新特征,通过建立一种时间序列的回归模型,具体包括:商家类别为需要外出购物的商店,而不是外卖服务,需进行标记,用天气特征进行加权;
对于用户浏览支付特征,需分析用户是否倾向于外卖服务,是否在特定的天气有特定的行为规律;
周末或者节假日也是影响整体消费的重要因素;是否是寒暑假影响着学生的消费;
商家的历史客流量,商家的地理位置,商家的规模也影响着该店铺在未来呈现一个什么样的趋势,这一类属于商家的历史统计特征;
对天气特征和雾霾也需要额外处理,因为人们外出与天气和空气质量有关、如果当天天气好,并且空气质量较高,那么那一天用户出行消费的概率越大,天气数据和雾霾数据是有用的。
5.根据权利要求1-4之一所述的基于历史商家记录及用户行为的电商消费客流量预测方法,其特征在于,对于每个商家,将测试时间段的14天的客流量预测为其训练时间段的客流量的均值,即(1)式中,YA为商家A的预测值;M为训练时间段日集;|M|表示训练时间段的日数;KA,m表示商家A在日m的客流量值,把均值看做是对训练时间段的客流量的回归,那么显然可以找到一个比均值更优秀的回归值,这个回归值应该满足在训练时间段的28天上的损失值最小,将这个值作为这个商家在待测的14天上的预测,即YA=argminy(∑m∈ML(y,KA,m)) (2)
(2)式中,L为损失函数,显然YA满足
YA∈[min(KA,m),max(KA,m)],m∈M (3)由于小于(1)式的预测值差异对成绩的影响基本可以忽略,遍历(3)式所确定的范围内的所有整数,选择其中最优秀的YA。
6.根据权利要求5所述的基于历史商家记录及用户行为的电商消费客流量预测方法,其特征在于,给选取的每一天加上一个权重,使得越靠近测试时间段的样本的权重越大,同时对于一个商家,越远离该商家开始营业的时间的样本的权重越大,设计了如下三个权重函数:wm,A,1=m-min(MA) (4)
wm,A,2=(m-min(M))3×(m-min(MA)) (5)式中MA表示商家A的所有营业的日子;m0表示待测时间段的首日;二日相减表示二者的日数距离,将(4)、(5)、(6)三者融合,得到最终采用的权重函数,wm,A=αwm,A,1+βwm,A,2+γwm,A,3 (7)式(7)中α,β,γ均为0,1之间的实数且满足α+β+γ=1,选择合适的α,β,γ,并将(7)改进为YA=argminy(∑m∈M(L(y,KA,m)×wm,A))) (8)
7.根据权利要求6所述的基于历史商家记录及用户行为的电商消费客流量预测方法,其特征在于,当商家的客流量具有明显的周期性,而且不同商家的周期性不同,设计了曜日权重函数v(ψ1,ψ2),其中,ψ1为训练时间段中的一个曜日;ψ2为测试时间段的一个曜日,v是曜日权重函数,且满足若当ψ,χ同为工作日或同为周末时,该函数得返回值较大,否则返回值较小,此时,(8)被改进为YA,μ,1=argminy(∑m∈M(L(y,KA,m)·wm,A·v(ψ(m),ψ(μ)))) (9)式(9)中,μ为测试时间段的一天;ψ(m)表示m日的曜日。
8.根据权利要求7所述的基于历史商家记录及用户行为的电商消费客流量预测方法,其特征在于,选取排除掉节日在内的异常因素的近六个月的时间段作为第二训练时间段,在这个时间段上,为每个曜日计算出一个最优系数,即能够在乘以这个系数后最小化损失值的系数,即式中,pA,ψ表示商家A在曜日ψ上的曜日占比;M’为第二训练时间段的日集,M’ψ表示第二时间段上属于曜日ψ的日集,Y(3),A,m表示以m所在周作为训练时间段,利用(3)的形式对商家A在m日的客流量做出的预测,排除训练样本中的周期性成分,然后重新加在对测试时间段的预测中,即二者加权相加,即
YA,μ=δYA,μ,1+εYA,μ,2 (12)
式中δ,ε均为0,1之间的实数且满足δ+ε=1。
9.根据权利要求8所述的基于历史商家记录及用户行为的电商消费客流量预测方法,其特征在于,按照暴雨、大雨、中雨、小雨、阴、多云、晴天气将天气数值化,并依据线下测试将该数值线性映射为系数,将(10),(11)分别改进为式中s(A)表示商家A所在地的市名,t(m,s)表示m日s市的天气系数,并将(12)改进为YA,μ=δYA,μ,3+εYA,μ,4 (15)(15)式中的结果便是时间序列加权回归模型预测的最终结果。