1.一种信息搜索中关键词淘汰方法,其特征在于,包括:
S1,基于被检索信息中关键词的词频和长度,获取所述被检索信息中关键词的生命周期;
S2,当所述被检索信息中关键词的生命周期结束时,淘汰该被检索信息中的关键词;
其中,S1具体包括:
S11,获取所述被检索信息中所有关键词总的字节长度和所述被检索信息的字节长度,并计算所述被检索信息中所有关键词总的字节长度与所述被检索信息的字节长度的第一比值;
S12,获取所述被检索信息中每个关键词出现的次数和所述被检索信息中所有关键词出现的总次数,并计算所述被检索信息中每个关键词出现的次数与所述被检索信息中所有关键词出现的总次数的第二比值;
S13,获取所述被检索信息的访问总量,根据所述第一比值、所述第二比值和所述访问总量,获取所述被检索信息中各个关键词的生命周期。
2.根据权利要求1所述的信息搜索中关键词淘汰方法,其特征在于,S13具体包括:将所述第一比值、所述第二比值和所述访问总量进行累乘,获取所述被检索信息中各个关键词的生命周期。
3.根据权利要求1所述的信息搜索中关键词淘汰方法,其特征在于,S2具体包括:当所述被检索信息中关键词的生命周期耗尽时,去掉该被检索信息中关键词的权重。
4.根据权利要求1至3任一所述的信息搜索中关键词淘汰方法,其特征在于,所述被检索信息中关键词的生命周期通过以下方式获取:其中,TTL表示所述被检索信息中关键词的生命周期,keyword_size表示所述被检索信息中所有关键词总的字节长度,total_size表示所述被检索信息的字节长度,pv表示所述被检索信息的访问总量,keyword_num表示所述被检索信息中每个关键词出现的次数,total_num表示所述被检索信息中所有关键词出现的总次数。
5.一种信息搜索中关键词淘汰装置,其特征在于,包括:
获取单元,用于基于被检索信息中关键词的词频和长度,获取所述被检索信息中关键词的生命周期;
淘汰单元,用于在所述被检索信息中关键词的生命周期结束时,淘汰该被检索信息的关键词;
其中,所述获取单元包括:
第一获取子单元,用于获取所述被检索信息中所有关键词总的字节长度和所述被检索信息的字节长度,并计算所述被检索信息中所有关键词总的字节长度与所述被检索信息的字节长度的第一比值;
第二获取子单元,用于获取所述被检索信息中每个关键词出现的次数和所述被检索信息中所有关键词出现的总次数,并计算所述被检索信息中每个关键词出现的次数与所述被检索信息中所有关键词出现的总次数的第二比值;
第三获取子单元,用于获取所述被检索信息的访问总量,根据所述第一比值、所述第二比值和所述访问总量,获取所述被检索信息中各个关键词的生命周期。
6.根据权利要求5所述的信息搜索中关键词淘汰装置,其特征在于,所述第三获取子单元具体用于:将所述第一比值、所述第二比值和所述访问总量进行累乘,获取所述被检索信息中各个关键词的生命周期。
7.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如权利要求1至4任一所述的方法。