欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2014104125364
申请人: 百度在线网络技术(北京)有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-02-23
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种搜索推荐方法,其特征在于,包括:

从用户输入的检索式中获取至少一个分词;

从所获取的分词中按照预设规则筛选出实体词,形成搜索实体词集合;

按照预设权重比算法分别获取所述搜索实体词集合中的实体词的权重比;

根据所述权重比对所述搜索实体词集合中的实体词进行筛选过滤;

对所述搜索实体词集合中的实体词进行拓展,根据扩展后的实体词生成推荐检索式。

2.根据权利要求1所述的搜索推荐方法,其特征在于,按照预设权重比算法分别获取所述搜索实体词集合中的实体词的权重比包括:在实体词知识图谱中查询所述搜索实体词集合,其中所述实体词知识图谱包括至少一个实体词集合中实体词之间的权重比;

如果实体词知识图谱包括所述搜索实体词集合,则查询所述实体词知识图谱,获取所述搜索实体词集合中的实体词的权重比;

如果实体词知识图谱不包括所述搜索实体词集合,则按照预设集合调整方法获取至少一个新搜索实体词集合,查询所述实体词知识图谱,获取所述至少一个新搜索实体词集合中的实体词的权重比,根据所述至少一个新搜索实体词集合中的实体词的权重比获取所述搜索实体词集合中的实体词的权重比。

3.根据权利要求2所述的搜索推荐方法,其特征在于,按照预设集合调整方法获取至少一个新搜索实体词集合包括:将所述搜索实体词集合中至少一个实体词替换为该实体词的父实体词,形成新搜索实体词集合;和/或获取所述搜索实体词集合的至少两个子集合,形成所述新搜索实体词集合。

4.根据权利要求3所述的搜索推荐方法,其特征在于,根据所述至少一个新搜索实体词集合中的实体词的权重比获取所述搜索实体词集合中的实体词的权重比包括:将调整前搜索实体词集合中的实体词,分别作为待计算的实体词,按照如下公式计算权重比,其中,Q为所述待计算的实体词的权重,stri-gram为所述待计算的实体词在包含三个实体词的子集合中的权重比;sbi-gram为所述待计算的实体词在包含两个实体词的子集合中的权重比,M为包含三个实体词的子集合的数目,N为包含两个实体词的子集合的数目,M和N分别为自然数,w1是预设第一系数,w2是预设第二系数;

按照上述方法分别计算所述搜索实体词集合中各实体词的权重,取所述各实体词的权重的比值作为调整前的搜索实体词集合中的实体词的权重比。

5.根据权利要求1所述的搜索推荐方法,其特征在于,根据所述权重比对所述搜索实体词集合中的实体词进行筛选过滤包括:根据所述权重比的权重排名顺序,从所述搜索实体词集合中筛选出排序靠前的设定数量的实体词;和/或根据所述权重比的权重排名顺序,从所述搜索实体词集合中筛选出排序靠后的设定数量的实体词。

6.根据权利要求1-5任一所述的搜索推荐方法,其特征在于,对所述搜索实体词集合中的实体词进行拓展包括:根据实体词的知识结构关系,对所述搜索实体词集合中的实体词进行替换;和/或根据所述实体词的修饰关系,向所述搜索实体词集合中添加至少一个实体词修饰词。

7.根据权利要求6所述的搜索推荐方法,其特征在于,根据实体词的知识结构关系,对所述搜索实体词集合中的实体词进行替换包括:通过查询实体词知识图谱,获取所述实体词的父实体词、子实体词、和/或兄弟实体词,将所述实体词替换为对应的父实体词、子实体词、和/或兄弟实体词。

8.根据权利要求7所述的搜索推荐方法,其特征在于,将所述实体词替换为对应的父实体词、子实体词、和/或兄弟实体词包括:通过查询实体词知识图谱,获取所述实体词拓展到其父实体词、子实体词和/或兄弟实体词的优选级关系向量;

根据所述优选级关系向量对所述实体词对应的父实体词、子实体词、和/或兄弟实体词进行筛选,并以筛选获得的实体词进行替换。

9.根据权利要求6所述的搜索推荐方法,其特征在于,根据所述实体词的修饰关系,向所述搜索实体词集合中添加至少一个实体词修饰词包括:从实体词知识图谱中查找所述搜索实体词集合中实体词的实体词修饰词,形成修饰词集合,获取所述搜索实体词集合中至少两个实体词的修饰词集合的并集,作为候选待添加词集合;或,从所述实体词知识图谱中查找所述搜索实体词集合中实体词的实体词修饰词,形成候选待添加词集合;

按照如下公式分别计算所述候选待添加词集合中候选待添加词,与所述搜索实体词集合的相关性:其中,E为所述搜索实体词集合,e为候选待添加词,R(E&e)为候选待添加词e与所述搜索实体词集合的相关性,P(E&e)为E与e在搜索日志中同时出现的概率,P(E)为E在搜索日志中单独出现的概率,P(e)为E在搜索日志中单独出现的概率;

根据所述相关性从所述候选待添加词集合中确定至少一个候选待添加词,向所述搜索实体词集合中添加。

10.根据权利要求6所述的搜索推荐方法,其特征在于,根据所述实体词的修饰关系,向所述搜索实体词集合中添加至少一个实体词修饰词包括:从实体词知识图谱中查找所述搜索实体词集合中实体词的实体词修饰词,形成修饰词集合,获取所述搜索实体词集合中至少两个实体词的修饰词集合的并集,作为候选待添加词集合;或,从所述实体词知识图谱中查找所述搜索实体词集合中实体词的实体词修饰词,形成候选待添加词集合;

按照如下公式分别计算所述候选待添加词集合中候选待添加词的权重:

其中,V为候选待添加词的权重,Ri为所述待计算的实体词修饰词与所述搜索实体词集合中第i个实体词的相关性,Ui为所述搜索实体词集合中第i个实体词的权重比,m为所述搜索实体词集合中包含的实体词的数目;

根据所述权重从所述候选待添加词集合中确定至少一个候选待添加词,向所述搜索实体词集合中添加。

11.一种搜索推荐装置,其特征在于,包括:

分词获取单元,用于从用户输入的检索式中获取至少一个分词;

实体词获取单元,用于从所获取的分词中按照预设规则筛选出实体词,形成搜索实体词集合;

权重计算与实体词筛选单元,用于按照预设权重比算法分别获取所述搜索实体词集合中的实体词的权重比;根据所述权重比对所述搜索实体词集合中的实体词进行筛选过滤;

实体词拓展单元,用于对所述搜索实体词集合中的实体词进行拓展,根据扩展后的实体词生成推荐检索式。

12.根据权利要求11所述的搜索推荐装置,其特征在于,所述权重计算与实体词筛选单元具体用于:在实体词知识图谱中查询所述搜索实体词集合,其中所述实体词知识图谱包括至少一个实体词集合中实体词之间的权重比;

如果实体词知识图谱包括所述搜索实体词集合,则查询所述实体词知识图谱,获取所述搜索实体词集合中的实体词的权重比;

如果实体词知识图谱不包括所述搜索实体词集合,则按照预设集合调整方法获取至少一个新搜索实体词集合,查询所述实体词知识图谱,获取所述至少一个新搜索实体词集合中的实体词的权重比,根据所述至少一个新搜索实体词集合中的实体词的权重比获取所述搜索实体词集合中的实体词的权重比。

13.根据权利要求12所述的搜索推荐装置,其特征在于,所述权重计算与实体词筛选单元具体用于:将所述搜索实体词集合中至少一个实体词替换为该实体词的父实体词,形成新搜索实体词集合;和/或获取所述搜索实体词集合的至少两个子集合,形成所述新搜索实体词集合。

14.根据权利要求13所述的搜索推荐装置,其特征在于,所述权重计算与实体词筛选单元具体用于:将调整前搜索实体词集合中的实体词,分别作为待计算的实体词,按照如下公式计算权重比,其中,Q为所述待计算的实体词的权重,stri-gram为所述待计算的实体词在包含三个实体词的子集合中的权重比;sbi-gram为所述待计算的实体词在包含两个实体词的子集合中的权重比,M为包含三个实体词的子集合的数目,N为包含两个实体词的子集合的数目,M和N分别为自然数,w1是预设第一系数,w2是预设第二系数;

按照上述方法分别计算所述搜索实体词集合中各实体词的权重,取所述各实体词的权重的比值作为调整前的搜索实体词集合中的实体词的权重比。

15.根据权利要求14所述的搜索推荐装置,其特征在于,所述权重计算与实体词筛选单元具体用于:根据所述权重比的权重排名顺序,从所述搜索实体词集合中筛选出排序靠前的设定数量的实体词;和/或根据所述权重比的权重排名顺序,从所述搜索实体词集合中筛选出排序靠后的设定数量的实体词。

16.根据权利要求10-15任一所述的搜索推荐装置,其特征在于,所述实体词拓展单元具体用于:根据实体词的知识结构关系,对所述搜索实体词集合中的实体词进行替换;和/或根据所述实体词的修饰关系,向所述搜索实体词集合中添加至少一个实体词修饰词。

17.根据权利要求16所述的搜索推荐装置,其特征在于,所述实体词拓展单元具体用于:通过查询实体词知识图谱,获取所述实体词的父实体词、子实体词、和/或兄弟实体词,将所述实体词替换为对应的父实体词、子实体词、和/或兄弟实体词。

18.根据权利要求16所述的搜索推荐装置,其特征在于,所述实体词拓展单元具体用于:从实体词知识图谱中查找所述搜索实体词集合中实体词的实体词修饰词,形成修饰词集合,获取所述搜索实体词集合中至少两个实体词的修饰词集合的并集,作为候选待添加词集合;或,从所述实体词知识图谱中查找所述搜索实体词集合中实体词的实体词修饰词,形成候选待添加词集合;

按照如下公式分别计算所述候选待添加词集合中候选待添加词,与所述搜索实体词集合的相关性:其中,E为所述搜索实体词集合,e为候选待添加词,R(E&e)为候选待添加词e与所述搜索实体词集合的相关性,P(E&e)为E与e在搜索日志中同时出现的概率,P(E)为E在搜索日志中单独出现的概率,P(e)为E在搜索日志中单独出现的概率;或按照如下公式分别计算所述候选待添加词集合中候选待添加词的权重:

其中,V为候选待添加词的权重,Ri为所述待计算的实体词修饰词与所述搜索实体词集合中第i个实体词的相关性,Ui为所述搜索实体词集合中第i个实体词的权重比,m为所述搜索实体词集合中包含的实体词的数目;

根据所述相关性或权重从所述候选待添加词集合中确定至少一个候选待添加词,向所述搜索实体词集合中添加。