1.基于SFT‑ALS的时间序列粉丝涨幅预测方法,具体步骤如下,其特征在于:步骤1,获取用户基础数据:经授权允许后,系统平台采集用户的基本信息,以及往期用户每日发布的视频数量、粉丝涨幅数据、视频点赞量、视频收藏量和视频播放量;
步骤2,数据特征提取:利用SFT获得数据缓慢变化的本质特征,同时提取数据的平均增长率特征;
步骤2中数据特征提取的过程表示为:除了将每日的视频更新量、粉丝量、视频点赞量、视频收藏量和视频播放量作为模型的特征,同时还提取了粉丝的平均增长率,公式如下:其中B为目前粉丝数,A为第一天粉丝数,m为年平均增长率;
步骤2中SFT提取的过程表示为:
同时提取粉丝的SFT特征,设粉丝时序信号为e(t),慢特征变量为si(t),i是信号维数,将慢特征算法的优化问题转化为:式中,<...>表示对时间取平均,·s是慢特征一阶导数,对特征变量进行线性转换可得:式中,gi(e)是慢特征算法中的映射函数,wi是负载矩阵,经过对粉丝时序信号的白化处理,奇异值分解操作后求得负载矩阵,求得粉丝时序信号的慢特征si;
步骤3,数据预处理:为了减少模型训练时间,对采集的用户基础数据进行归一化处理;
步骤3中数据预处理的过程表示为:
为了减少模型的训练时间,对步骤2中提取用户每日的视频更新量、粉丝量、视频点赞量、视频收藏量、视频播放量、粉丝平均增长率和粉丝SFT特征分别进行归一化处理,归一化处理后的特征值区间在[‑1,1],归一化公式如下:式中,x’是归一化处理后的特征矩阵,x是步骤2中提取的特征矩阵,xmax和xmin分别特征的最大值和最小值矩阵;
步骤4,将经特征处理后的特征集组成混合矩阵送入ALS模型中进行矩阵分解,并重构混合矩阵;
步骤4中ALS模型重构混合矩阵的过程表示为:将经过归一化处理后的特征矩阵和每日的粉丝增长量组合成混合矩阵Rm*n,n是特征数加1,m是用户数据的使用天数;步骤4.1:把混合矩阵近似设为
式中Xm*k和 是Rm*n分解得到的低维矩阵,参数k是低维矩阵的维数;
步骤4.2:为了使等式两边尽可能相等,构造交替最小二乘法的平方误差损失函数:式中Rui、Xu、Yi分别是Rm*n、Xm*k、Yn*k的简写,L(X,Y)是平方误差损失函数;
步骤4.3,此时矩阵分解问题可转化为求解平方误差损失函数最小:ALS算法的关键是要找到最优的Xm*k和Yn*k,使得L(X,Y)最小,由于Xm*k和Yn*k是未知的,所以式的求解问题式非凸的,ALS算法的思路是固定其中一个矩阵,再去求解另一个矩阵,具体算法如下:步骤4.3.1先取随机值固定Xu;
步骤4.3.2对L(X,Y)求解Yi的偏导,并令偏导为0,可求解YiT ‑1 T
Yi=(xx+λI) xRi (8)步骤4.3.3再将上式求解的Yi固定,同理可求出XuT ‑1 T
Xu=(YY+λI) YRu (9)步骤4.3.4不断重复步骤4.3.2和步骤4.3.3,直到L(X,Y)达到目标值或者达到最大迭代次数;
起初Xu和Yi是随机矩阵,交替最小二乘法通过不断的交替迭代,修改Xu和Yi,从而得到最终的Xu和Yi的值;求解出Xu和Yi后,通过式5重构混合矩阵,重构后的混合矩阵含有待求解的未来粉丝涨幅数量;
步骤5,使用遗传算法对不同数据源的训练模型进行寻优处理,得到最优低维矩阵的维数k;
步骤6,将训练获得的粉丝涨幅模型嵌入平台系统中,并实际应用。
2.根据权利要求1所述的基于SFT‑ALS的时间序列粉丝涨幅预测方法,其特征在于:步骤5中遗传算法寻优的过程表示为:k=GA(x′,ALS) (10)其中,x′为数据集的特征矩阵,ALS表示数据集训练的ALS模型,GA(·)是遗传算法函数。