欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2016107300542
申请人: 北京百度网讯科技有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-02-26
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种训练数据的生成方法,其特征在于,包括以下步骤:获取用户的历史搜索数据,其中,所述历史搜索数据包括历史搜索词和所述历史搜索词对应的历史搜索结果;

获取所述用户的历史查询点击行为,并根据所述历史查询点击行为对所述历史搜索词对应的历史搜索结果进行分类以生成所述历史搜索结果的标签;

根据预设策略、所述历史搜索结果的标签、所述历史搜索词以及所述历史搜索结果生成训练数据。

2.如权利要求1所述的方法,其特征在于,所述根据预设策略、所述历史搜索结果的标签、所述历史搜索词以及所述历史搜索结果生成训练数据,包括:根据所述预设策略和所述历史搜索结果的标签对所述历史搜索结果进行配对组合,以得到多个结果组对;

根据所述历史搜索词以及所述多个结果组对生成所述训练数据。

3.如权利要求2所述的方法,其特征在于,其中,所述标签包括第一标签、第二标签和第二标签,其中,所述第一标签用于指示点击的搜索结果,所述第二标签用于指示跳过的搜索结果,所述第三标签用于指示还没查看的搜索结果。

4.如权利要求3所述的方法,其特征在于,所述预设策略包括:将所述标签为所述第一标签的历史搜索结果与所述标签为所述第三标签的历史搜索结果进行配对组合;和/或,将所述标签为所述第二标签和第三标签的历史搜索结果,与所述标签为所述第一标签的历史搜索结果进行配对组合。

5.一种基于神经网络模型的搜索方法,其特征在于,包括:接收搜索词;

根据权利要求1至4中任一项所述的训练数据的生成方法获取所述训练数据;

基于所述神经网络模型,根据所述搜索词和所述训练数据获取与所述搜索词对应的多个搜索结果,并计算所述多个搜索结果与所述搜索词的相关度;

根据所述相关度对所述多个搜索结果进行排序,并将排序后的所述多个搜索结果提供给用户。

6.一种训练数据的生成装置,其特征在于,包括:第一获取模块,用于获取用户的历史搜索数据,其中,所述历史搜索数据包括历史搜索词和所述历史搜索词对应的历史搜索结果;

第二获取模块,用于获取所述用户的历史查询点击行为;

第一生成模块,用于根据所述历史查询点击行为对所述历史搜索词对应的历史搜索结果进行分类以生成所述历史搜索结果的标签;

第二生成模块,用于根据预设策略、所述历史搜索结果的标签、所述历史搜索词以及所述历史搜索结果生成训练数据。

7.如权利要求6所述的装置,其特征在于,所述第二生成模块包括:配对单元,用于根据所述预设策略和所述历史搜索结果的标签对所述历史搜索结果进行配对组合,以得到多个结果组对;

生成单元,用于根据所述历史搜索词以及所述多个结果组对生成所述训练数据。

8.如权利要求7所述的装置,其特征在于,其中,所述标签包括第一标签、第二标签和第二标签,其中,所述第一标签用于指示点击的搜索结果,所述第二标签用于指示跳过的搜索结果,所述第三标签用于指示还没查看的搜索结果。

9.如权利要求8所述的装置,其特征在于,所述预设策略包括:将所述标签为所述第一标签的历史搜索结果与所述标签为所述第三标签的历史搜索结果进行配对组合;和/或,将所述标签为所述第二标签和第三标签的历史搜索结果,与所述标签为所述第一标签的历史搜索结果进行配对组合。

10.一种基于神经网络模型的搜索装置,其特征在于,包括:接收模块,用于接收搜索词;

第一获取模块,用于根据权利要求6至9中任一项所述的训练数据的生成装置获取所述训练数据;

第二获取模块,用于基于所述神经网络模型,根据所述搜索词和所述训练数据获取与所述搜索词对应的多个搜索结果,并计算所述多个搜索结果与所述搜索词的相关度;

排序模块,用于根据所述相关度对所述多个搜索结果进行排序;

提供模块,用于将排序后的所述多个搜索结果提供给用户。