欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2014106525713
申请人: 百度在线网络技术(北京)有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-02-23
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种通过计算机实现的用于生成趋势解释数据的方法,其特征在于,所述方法包括:获取用户搜索日志;

从所述用户搜索日志提取与一组待考查搜索词关联搜索的第一关联搜索词、关联时间点及其搜索次数;

根据提取的第一关联搜索词、关联时间点及其搜索次数以及所述用户搜索日志选取搜索次数改变幅度超过预定标准的第二关联搜索词、其在搜索次数上的变化方向以及变化时间区间,所述变化方向为正向或反向;

根据所述第二关联搜索词以及变化时间区间生成趋势解释数据。

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

从要考查的目标词包、用户访问的标题集合或者用户访问的非结构化数据提取所述一组待考查搜索词。

3.根据权利要求2所述的方法,其特征在于,所述用户搜索日志包括来自多个数据源的互联网搜索记录。

4.根据权利要求3所述的方法,其特征在于,所述方法还包括:

将所述第二关联搜索词的变化时间区间映射到所述一组待考查搜索词的搜索变化曲线上,根据所述一组待考查搜索词的搜索次数的变化筛选出变化方向匹配的第三关联搜索词,并且所述根据所述第二关联搜索词以及变化时间区间生成趋势解释数据的处理包括:根据所述第三关联搜索词以及变化时间区间生成趋势解释数据。

5.根据权利要求4所述的方法,其特征在于,所述根据所述一组待考查搜索词的搜索次数的变化筛选出变化方向匹配的第三关联搜索词的处理包括:对于任一所述第二关联搜索词,执行以下操作:

自所述第二关联搜索词的变化时间区间的区间起始时间点回溯至所述搜索变化曲线上沿所述第二关联搜索词的变化方向延伸到的阶段起始时间点,计算在所述第二关联搜索词的变化时间区间内所述待考查搜索词的第一平均搜索次数以及所述阶段起始时间点和所述区间起始时间点之间所述待考查搜索词的第二平均搜索次数,根据所述变化方向、所述第一平均搜索次数和第二平均搜索次数的值确定是否将所述第二关联搜索词选取为第三关联搜索词。

6.根据权利要求5所述的方法,其特征在于,所述根据所述变化方向、所述第一平均搜索次数和第二平均搜索次数的值确定是否选取所述关联搜索词的处理包括:如果所述变化方向为正向,并且所述第二平均搜索次数小于所述第一平均搜索次数,则选取所述关联搜索词,如果所述变化方向为负向,并且所述第二平均搜索次数大于所述第一平均搜索次数,则选取所述关联搜索词,如果所述变化方向为正向并且所述第二平均搜索次数不小于所述第一平均搜索次数,或者如果所述变化方向为负向并且所述第二平均搜索次数不大于所述第一平均搜索次数,则不选取所述关联搜索词。

7.根据权利要求5所述的方法,其特征在于,所述根据所述变化方向、所述第一平均搜索次数和第二平均搜索次数的值确定是否选取所述关联搜索词的处理包括:如果所述变化方向为正向,所述第二平均搜索次数小于所述第一平均搜索次数,并且所述第一平均搜索次数与所述第二平均搜索次数之间的差大于预定的第一搜索次数阈值,则选取所述关联搜索词,如果所述变化方向为负向,所述第二平均搜索次数大于所述第一平均搜索次数,并且所述第二平均搜索次数与所述第一平均搜索次数之间的差大于预定的第二搜索次数阈值,则选取所述关联搜索词,如果所述变化方向为正向并且所述第二平均搜索次数不小于所述第一平均搜索次数,则不选取所述关联搜索词,如果所述变化方向为正向,所述第二平均搜索次数小于所述第一平均搜索次数,并且所述第一平均搜索次数与所述第二平均搜索次数之间的差不大于预定的第一搜索次数阈值,则不选取所述关联搜索词,如果所述变化方向为负向并且所述第二平均搜索次数不大于所述第一平均搜索次数,则不选取所述关联搜索词,如果所述变化方向为负向,所述第二平均搜索次数大于所述第一平均搜索次数,并且所述第二平均搜索次数与所述第一平均搜索次数之间的差不大于预定的第二搜索次数阈值,则选取所述关联搜索词。

8.根据权利要求1~7中任一项所述的方法,其特征在于,所述从所述用户搜索日志提取与一组待考查搜索词关联搜索的第一关联搜索词、关联时间点及其搜索次数的处理包括:从所述用户搜索日志提取任一用户在一定时间间隔内与所述一组待考查搜索词中的任一待考查搜索词一同搜索的搜索词,以及/或者在任一查询搜索词中与所述一组待考查搜索词中的任一待考查搜索词一同出现的搜索词作为第一关联搜索词,按照预定的统计时间段单位,将所述第一关联搜索词被搜索的统计单位时间段作为其关联时间点,并且统计所述关联搜索词在所述统计单位时间段内被搜索的次数作为其搜索次数。

9.根据权利要求8所述的方法,其特征在于,所述从所述用户搜索日志提取与一组待考查搜索词关联搜索的第一关联搜索词、关联时间点及其搜索次数的处理还包括:从提取的第一关联搜索词删除这样的搜索词:其与所述一组待考查搜索词中的任一待考查搜索词一同出现的次数低于预定的共现次数。

10.根据权利要求9所述的方法,其特征在于,所述根据提取的第一关联搜索词、关联时间点及其搜索次数以及所述用户搜索日志选取搜索次数改变幅度超过预定标准的第二关联搜索词、其在搜索次数上的变化方向以及变化时间区间的处理包括:对任一所述第一关联搜索词,执行以下操作:

根据所述用户搜索日志获取在其关联时间点前的预定的考查时间段内的所述统计单位时间段的搜索次数均值,如果所述第一关联搜索词的搜索次数相对于所述搜索次数均值的改变幅度超过预定改变阈值,则将所述第一关联搜索词选取为第二关联搜索词,并且将所述第一关联搜索词的搜索次数相对于所述搜索次数均值的改变方向作为所述第二关联搜索词在搜索次数上的变化方向,对任一选取的第二关联搜索词,将其相邻的关联时间点连续或间隔小于预定时间间隔的关联时间点合并成为其变化时间区间。

11.根据权利要求10所述的方法,其特征在于,所述根据所述筛选出的第三关联搜索词以及变化时间区间生成趋势解释数据的处理包括:根据所述第三关联搜索词从多个数据源获取描述数据,并且获取其变化时间区间内的搜索次数,根据所述第三关联搜索词的所述描述数据和搜索次数生成所述变化时间区间的趋势解释数据。

12.根据权利要求11所述的方法,其特征在于,所述根据所述筛选出的第三关联搜索词以及变化时间区间生成趋势解释数据的处理还包括:对于变化时间区间重叠的第三关联搜索词,按照其在所述变化时间区间被搜索的次数由高到低的顺序排序。

13.一种用于生成趋势解释数据的装置,其特征在于,所述装置包括:日志获取单元,用于获取用户搜索日志;

第一信息提取单元,用于从所述用于搜索日志提取与一组待考查搜索词关联搜索的第一关联搜索词、关联搜索时间点及其搜索次数;

第二信息提取单元,用于根据第一信息提取单元提取的第一关联搜索词、关联时间点及其搜索次数以及所述用户搜索日志选取搜索次数改变幅度超过预定标准的第二关联搜索词、其在搜索次数上的变化方向以及变化时间区间,所述变化方向为正向或反向;

趋势解释数据生成单元,用于根据所述第二关联搜索词以及变化时间区间生成趋势解释数据。

14.根据权利要求13所述的装置,其特征在于,所述装置还包括:待考查搜索词获取单元,用于从要考查的目标词包、用户访问的标题集合或者用户访问的非结构化数据提取所述一组待考查搜索词。

15.根据权利要求14所述的装置,其特征在于,所述装置还包括:第三关联搜索词获取单元,用于将所述第二关联搜索词的变化时间区间映射到所述一组待考查搜索词的搜索变化曲线上,根据所述一组待考查搜索词的搜索次数的变化筛选出变化方向匹配的第三关联搜索词,并且所述趋势解释数据生成单元用于根据所述第三关联搜索词以及变化时间区间生成趋势解释数据。

16.根据权利要求15所述的装置,其特征在于,所述第三关联搜索词获取单元用于对于任一所述第二关联搜索词,执行以下操作:自所述第二关联搜索词的变化时间区间的区间起始时间点回溯至所述搜索变化曲线上沿所述第二关联搜索词的变化方向延伸到的阶段起始时间点,计算在所述第二关联搜索词的变化时间区间内所述待考查搜索词的第一平均搜索次数以及所述阶段起始时间点和所述区间起始时间点之间所述待考查搜索词的第二平均搜索次数,根据所述变化方向、所述第一平均搜索次数和第二平均搜索次数的值确定是否将所述第二关联搜索词选取为第三关联搜索词。

17.根据权利要求16所述的装置,其特征在于,

如果所述变化方向为正向,并且所述第二平均搜索次数小于所述第一平均搜索次数,则所述第三关联搜索词获取单元选取所述关联搜索词,如果所述变化方向为负向,并且所述第二平均搜索次数大于所述第一平均搜索次数,则所述第三关联搜索词获取单元选取所述关联搜索词,如果所述变化方向为正向并且所述第二平均搜索次数不小于所述第一平均搜索次数,或者如果所述变化方向为负向并且所述第二平均搜索次数不大于所述第一平均搜索次数,则所述第三关联搜索词获取单元不选取所述关联搜索词。

18.根据权利要求13~17中任一项所述的装置,其特征在于,所述第一信息提取单元用于:从所述用户搜索日志提取任一用户在一定时间间隔内与所述一组待考查搜索词中的任一待考查搜索词一同搜索的搜索词,以及/或者在任一查询搜索词中与所述一组待考查搜索词中的任一待考查搜索词一同出现的搜索词作为第一关联搜索词,按照预定的统计时间段单位,将所述第一关联搜索词被搜索的统计单位时间段作为其关联时间点,并且统计所述关联搜索词在所述统计单位时间段内被搜索的次数作为其搜索次数。

19.根据权利要求18所述的装置,其特征在于,所述第二信息提取单元用于:对任一所述第一关联搜索词,执行以下操作:

根据所述用户搜索日志获取在其关联时间点前的预定的考查时间段内的所述统计单位时间段的搜索次数均值,如果所述第一关联搜索词的搜索次数相对于所述搜索次数均值的改变幅度超过预定改变阈值,则将所述第一关联搜索词选取为第二关联搜索词,并且将所述第一关联搜索词的搜索次数相对于所述搜索次数均值的改变方向作为所述第二关联搜索词在搜索次数上的变化方向,第二信息提取单元还用于对任一选取的第二关联搜索词,将其相邻的关联时间点连续或间隔小于预定时间间隔的关联时间点合并成为其变化时间区间。

20.根据权利要求19所述的装置,其特征在于,所述趋势解释数据生成单元用于:根据所述第三关联搜索词从多个数据源获取描述数据,并且获取其变化时间区间内的搜索次数,根据所述第三关联搜索词的所述描述数据和搜索次数生成所述变化时间区间的趋势解释数据,其中,对于变化时间区间重叠的第三关联搜索词,所述趋势解释数据生成单元还用于按照其在所述变化时间区间被搜索的次数由高到低的顺序排序。