1.一种基于孪生神经网络的基站标号轨迹分类方法,其特征在于,所述方法包括如下步骤:(1)历史基站标号轨迹数据集采集:首先对用户智能手机所连接基站的标号发生切换时进行数据采集,然后对采集到的数据进行轨迹分割得到大量基站标号轨迹,以形成历史基站标号轨迹数据集;
(2)基站标号向量化:基于word2vec算法对历史基站标号轨迹数据集进行分析,在此基础上为其中包含的每个基站标号生成一个具有语义的向量;
(3)基站标号轨迹相似度模型训练:基于孪生神经网络训练基站标号轨迹相似度模型,用以估计任意两条基站标号轨迹的相似度;
(4)在线基站标号轨迹分类:给定一条新的基站标号轨迹,将其分类为历史基站标号轨迹类型的一种,或认定其为新的基站标号轨迹类型。
2.如权利要求1所述的一种基于孪生神经网络的基站标号轨迹分类方法,其特征在于,所述步骤(2)中,基站标号向量化的过程如下:(2-1)基站标号轨迹“文档”化:将一条基站标号轨迹看作一个“文档”,将其中包含的每个基站标号看作一个“词”,则历史基站标号轨迹数据集可看作一个“语料库”;
(2-2)基站标号向量生成:基于word2vec算法对看作“语料库”的历史基站标号轨迹数据集进行分析,得到其中包含的每个看作“词”的基站标号对应的向量。
3.如权利要求1或2所述的一种基于孪生神经网络的基站标号轨迹分类方法,其特征在于,所述步骤(3)中,基站标号轨迹相似度模型训练的过程如下:(3-1)历史基站标号轨迹数据集标注:根据用户的运动路径人工将历史基站标号轨迹分成不同类型,则任意两条基站标号轨迹的关系为1或0,1表示相同类型,0表示不同类型;
(3-2)相似度模型训练:采用孪生神经网络训练相似度模型,对网络结构的解释如下:输入层:网络的输入为两条基站标号轨迹,记为TA和TB,首先将TA和TB中所有的基站标号替换为其对应的向量,得到两条向量序列vTA和vTB;然后通过尾部截断或尾部填充全0向量的方式将vTA和vTB处理成固定相同的长度;
循环层:循环层用两个参数完全共享的GRU网络,记为GRUA和GRUB,分别处理输入的vTA和vTB,循环层的输出为GRUA的最后一个隐状态向量 和GRUB的最后一个隐状态向量交互层:交互层基于余弦相似度计算 和 的相似度;
输出层:输出层的输出为TA和TB的预测相似度值,模型采用对比损失函数作为训练的损失函数。
4.如权利要求1或2所述的一种基于孪生神经网络的基站标号轨迹分类方法,其特征在于,所述步骤(4)中,在线基站标号轨迹分类的过程如下:(4-1)历史类型中心基站标号轨迹生成:对用户标注的每一个历史基站标号轨迹类型Ci,在其包含的基站标号轨迹集中找到一条中心基站标号轨迹cTi;
(4-2)当前基站标号轨迹分类:给定一条新的基站标号轨迹nT,基于训练好的基站标号轨迹相似度模型计算nT与每个历史基站标号轨迹类型Ci的中心基站标号轨迹cTi的相似度值si,若其中最大的相似度值si小于指定阈值sThres,或nT中包含的无对应向量的基站标号数量大于指定阈值nThres,则输出一种新的基站标号轨迹类型nC;反之,则输出历史基站标号轨迹类型Ci;
(4-3)历史基站标号轨迹数据集扩充:若nT的分类结果为Ci,则将nT加入Ci对应的基站标号轨迹集,并重新生成Ci的中心基站标号轨迹;若nT的分类结果为nC,则将nC加入历史基站标号轨迹类型集,并将nT作为nC的中心基站标号轨迹。