1.一种移动应用功能演化趋势预测方法,其特征在于,包括:根据预设的数据采集条件及数据采集网址,从所述数据采集网址对应采集获取应用程序版本更新记录信息集;其中,所述应用程序版本更新记录信息集中包括若干条应用程序版本更新记录信息,每一条应用程序版本更新记录信息包括若干条应用程序版本更新文本;
获取所采集的应用程序版本更新记录信息集,将所述应用程序版本更新记录信息集中每一条应用程序版本更新文本进行预处理,以组成处理后应用程序版本更新文本集;其中,所述处理后应用程序版本更新记录信息集中包括若干条处理后应用程序版本更新文本;
获取所述处理后应用程序版本更新记录信息集中每一处理后应用程序版本更新文本对应的标注值,由处理后应用程序版本更新文本及对应的标注值组成训练集和测试集;
通过所述训练集对待训练SVM模型和待训练决策树模型分别进行模型训练,得到SVM模型和决策树模型;
通过所述测试集获取所述SVM模型对应的第一模型稳定参数,并通过所述测试集获取所述决策树模型对应的第二模型稳定参数;
获取所述第一模型稳定参数和所述第二模型稳定参数中较大者对应的模型,以作为目标模型;以及
若检测接收到用户端发送的当前应用程序版本更新记录信息,将所述当前应用程序版本更新记录信息作为所述目标模型的输入进行预测,得到预测结果。
2.根据权利要求1所述的移动应用功能演化趋势预测方法,其特征在于,所述获取所采集的应用程序版本更新记录信息集,将所述应用程序版本更新记录信息集中每一条应用程序版本更新文本进行预处理,以组成处理后应用程序版本更新文本集,包括:若检测到应用程序版本更新文本对应的文本标题与预设的标题关键词相同,将对应的应用程序版本更新文本从所述应用程序版本更新记录信息集中进行去重,得到处理后应用程序版本更新文本集。
3.根据权利要求1所述的移动应用功能演化趋势预测方法,其特征在于,所述获取所述处理后应用程序版本更新记录信息集中每一处理后应用程序版本更新文本对应的标注值,包括:
通过OCR自动识别和OCR自动标注对每一处理后应用程序版本更新文本进行自动标注,得到与各条处理后应用程序版本更新文本对应的标注值。
4.根据权利要求3所述的移动应用功能演化趋势预测方法,其特征在于,所述通过所述训练集对待训练SVM模型和待训练决策树模型分别进行模型训练,得到SVM模型和决策树模型之前,还包括:
将每一条处理后应用程序版本更新文本对应进行分词、关键词抽取及词向量转换,得到与各处理后应用程序版本更新文本对应的词向量集合。
5.根据权利要求1所述的移动应用功能演化趋势预测方法,其特征在于,所述通过所述测试集获取所述SVM模型对应的第一模型稳定参数,并通过所述测试集获取所述决策树模型对应的第二模型稳定参数,包括:
通过P1=TP1/(TP1+FP1)计算第一模型稳定参数;其中,P1是所述SVM模型对应的精确率,TP1是所述SVM模型对应的测试集中真正例的个数,FP1是所述SVM模型对应的测试集中假正例的个数;
通过P2=TP2/(TP2+FP2)计算第二模型稳定参数;其中,P2是所述决策树模型对应的精确率,TP2是所述决策树模型对应的测试集中真正例的个数,FP2是所述决策树模型对应的测试集中假正例的个数。
6.根据权利要求5所述的移动应用功能演化趋势预测方法,其特征在于,所述通过所述测试集获取所述SVM模型对应的第一模型稳定参数,并通过所述测试集获取所述决策树模型对应的第二模型稳定参数,包括;
通过F1=2TP1/(2TP1+FP1+FN1)计算第一模型稳定参数;其中,F1是所述SVM模型对应的精确率及召回率调和均值,TP1是所述SVM模型对应的测试集中真正例的个数,FP1是所述SVM模型对应的测试集中假正例的个数,FN1是所述SVM模型对应的测试集中真负例的个数;
通过F2=2TP2/(2TP2+FP2+FN2)计算第二模型稳定参数;其中,F2是所述决策树模型对应的精确率及召回率调和均值,TP2是所述决策树模型对应的测试集中真正例的个数,FP2是所述决策树模型对应的测试集中假正例的个数,FN2是所述决策树模型对应的测试集中真负例的个数。
7.根据权利要求4所述的移动应用功能演化趋势预测方法,其特征在于,所述将每一条处理后应用程序版本更新文本对应进行分词、关键词抽取及词向量转换,得到与各处理后应用程序版本更新文本对应的词向量集合,包括:将每一条处理后应用程序版本更新文本对应通过N‑Gram模型进行分词,得到与各处理后应用程序版本更新文本对应的分词结果;
将各处理后应用程序版本更新文本对应的分词结果通过词频‑逆文本频率指数模型进行关键词抽取,得到与各处理后应用程序版本更新文本对应的关键词抽取结果;
将各处理后应用程序版本更新文本对应的关键词抽取结果通过word2vec模型进行词向量转换,得到与各处理后应用程序版本更新文本对应的词向量集合。
8.一种移动应用功能演化趋势预测装置,其特征在于,包括:版本更新记录信息集采集单元,用于根据预设的数据采集条件及数据采集网址,从所述数据采集网址对应采集获取应用程序版本更新记录信息集;其中,所述应用程序版本更新记录信息集中包括若干条应用程序版本更新记录信息,每一条应用程序版本更新记录信息包括若干条应用程序版本更新文本;
文本预处理单元,用于获取所采集的应用程序版本更新记录信息集,将所述应用程序版本更新记录信息集中每一条应用程序版本更新文本进行预处理,以组成处理后应用程序版本更新文本集;其中,所述处理后应用程序版本更新记录信息集中包括若干条处理后应用程序版本更新文本;
训练集获取单元,用于获取所述处理后应用程序版本更新记录信息集中每一处理后应用程序版本更新文本对应的标注值,由处理后应用程序版本更新文本及对应的标注值组成训练集和测试集;
模型训练单元,用于通过所述训练集对待训练SVM模型和待训练决策树模型分别进行模型训练,得到SVM模型和决策树模型;
模型评估参数获取单元,用于通过所述测试集获取所述SVM模型对应的第一模型稳定参数,并通过所述测试集获取所述决策树模型对应的第二模型稳定参数;
目标模型获取单元,用于获取所述第一模型稳定参数和所述第二模型稳定参数中较大者对应的模型,以作为目标模型;以及预测单元,用于若检测接收到用户端发送的当前应用程序版本更新记录信息,将所述当前应用程序版本更新记录信息作为所述目标模型的输入进行预测,得到预测结果。
9.一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述的移动应用功能演化趋势预测方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行如权利要求1至7任一项所述的移动应用功能演化趋势预测方法。