1.一种基于门控循环神经网络(Gated RNN)的搜索排序模型的训练方法,其特征在于,所述方法包括:获取多组标注的样本数据,每组所述样本数据包括搜索词及其相应的被标注为正例或负例的多个搜索结果条目;
根据多组样本数据中的搜索词及其相应的搜索结果条目生成基于Gated RNN的搜索排序模型的输入层、词向量层、隐藏层和输出层;
对所述搜索排序模型进行训练,以学习所述搜索排序模型的参数。
2.根据权利要求1所述的训练方法,其特征在于,所述被标注为正例的搜索结果条目是被点击过的搜索结果条目,所述被标注为负例的搜索结果条目是未被点击过的搜索结果条目。
3.根据权利要求2所述的训练方法,其特征在于,所述根据所述多组样本数据中的搜索词及其相应的搜索结果条目生成基于Gated RNN的搜索排序模型的输入层和词向量层的处理包括:对所述搜索词、与所述搜索词相对应的搜索结果条目分别进行分词,由分词结果生成输入层,从预先定义的词表分别查找到分得的每个分词对应的词向量,由所述词向量生成词向量层。
4.根据权利要求3所述的训练方法,其特征在于,所述根据所述多组样本数据中的搜索词及其相应的搜索结果条目生成基于Gated RNN的搜索排序模型的隐藏层的处理包括:对所述词向量层进行非线性变换计算得到隐藏层。
5.根据权利要求4所述的训练方法,其特征在于,所述根据所述多组样本数据中的搜索词及其相应的搜索结果条目生成基于Gated RNN的搜索排序模型的输出层的处理包括:根据得到的隐藏层计算所述样本数据中的搜索词分别与相应的被标注为正例或负例的多个搜索结果条目的相似度,将计算得到的各个相似度的值作为所述搜索排序模型的输出层。
6.根据权利要求4所述的训练方法,其特征在于,所述对所述词向量层进行非线性变换计算得到隐藏层的处理包括:对所述词向量层的任一词向量,都进行如下处理,直至得到所述隐藏层中全部的向量:获取当前的词向量,
根据所述当前的词向量、基于Gated RNN搜索排序模型的搜索词的隐藏层变换矩阵参数以及搜索结果条目的隐藏层变换矩阵参数,得到更新数据和重置数据,根据所述更新数据和所述重置数据对所述当前的词向量的前一词向量对应隐藏层的向量进行处理,得到所述当前的词向量对应的隐藏层的向量。
7.根据权利要求5所述的训练方法,其特征在于,所述根据得到的隐藏层计算所述样本数据中的搜索词分别与相应的被标注为正例或负例的多个搜索结果条目的相似度,将计算得到的各个相似度的值作为所述搜索排序模型的输出层的处理包括:分别将所述搜索词、相应的被标注为正例或负例的多个搜索结果条目的分词结果中最后一个分词对应在所述隐藏层的向量作为所述搜索词、所述相应的被标注为正例或负例的多个搜索结果条目的向量,利用所述向量计算所述搜索词分别与相应的被标注为正例或负例的多个搜索结果条目的相似度,将计算得到的各个相似度的值作为所述搜索排序模型的输出层。
8.根据权利要求1所述的训练方法,其特征在于,所述对所述搜索排序模型进行训练,以学习所述搜索排序模型的参数的处理包括:根据所述搜索词分别与相应的被标注为正例或负例的多个搜索结果条目的相似度建立损失函数,利用所述样本数据对所述损失函数进行训练,获取使得所述损失函数最小的所述基于Gated RNN的搜索排序模型的参数集合。
9.一种搜索处理方法,其特征在于,所述方法包括:
接收用户的搜索词;
根据所述搜索词获取多个搜索结果条目;
以所述搜索词和所述多个搜索结果条目作为输入,从经训练的基于Gated RNN的搜索排序模型中分别获取每个所述搜索结果条目的排序分数;
根据所述排序分数对所述多个搜索结果条目进行排序;
发送经排序的搜索结果条目。
10.根据权利要求9所述的方法,其特征在于,所述以所述搜索词和所述多个搜索结果条目作为输入,从经训练的基于Gated RNN的搜索排序模型中分别获取每个所述搜索结果条目的排序分数的处理包括:获取所述经训练的基于Gated RNN的搜索排序模型的参数,
根据所述参数将所述搜索词和所述多个搜索结果条目分别转换成向量表示,根据由向量表示的所述搜索词和所述多个搜索结果条目分别计算所述搜索词和每个所述搜索结果条目之间的相似度值,并将与每个所述搜索结果条目对应的相似度值作为每个所述搜索结果条目的排序分数。
11.一种基于门控循环神经网络(Gated RNN)的搜索排序模型的训练装置,其特征在于,所述装置包括:样本数据获取模块,用于获取多组标注的样本数据,每组所述样本数据包括搜索词及其相应的被标注为正例或负例的多个搜索结果条目;
搜索排序模型生成模块,用于根据多组样本数据中的搜索词及其相应的搜索结果条目生成基于Gated RNN的搜索排序模型的输入层、词向量层、隐藏层和输出层;
参数学习模块,用于对所述搜索排序模型进行训练,以学习所述搜索排序模型的参数。
12.根据权利要求11所述的训练装置,其特征在于,所述被标注为正例的搜索结果条目是被点击过的搜索结果条目,所述被标注为负例的搜索结果条目是未被点击过的搜索结果条目。
13.根据权利要求12所述的训练装置,其特征在于,所述搜索排序模型生成模块用于对所述搜索词、与所述搜索词相对应的搜索结果条目分别进行分词,由分词结果生成输入层,从预先定义的词表分别查找到分得的每个分词对应的词向量,由所述词向量生成词向量层。
14.根据权利要求13所述的训练装置,其特征在于,所述搜索排序模型生成模块还用于对所述词向量层进行非线性变换计算得到隐藏层。
15.根据权利要求14所述的训练装置,其特征在于,所述搜索排序模型生成模块还用于根据得到的隐藏层计算所述样本数据中的搜索词分别与相应的被标注为正例或负例的多个搜索结果条目的相似度,将计算得到的各个相似度的值作为所述搜索排序模型的输出层。
16.根据权利要求14所述的训练装置,其特征在于,所述搜索排序模型生成模块还用于对所述词向量层的任一词向量,都进行如下处理,直至得到所述隐藏层中全部的向量:获取当前的词向量,根据所述当前的词向量、基于Gated RNN搜索排序模型的搜索词的隐藏层变换矩阵参数以及搜索结果条目的隐藏层变换矩阵参数,得到更新数据和重置数据,根据所述更新数据和所述重置数据对所述当前的词向量的前一词向量对应隐藏层的向量进行处理,得到所述当前的词向量对应的隐藏层的向量。
17.根据权利要求15所述的训练装置,其特征在于,所述搜索排序模型生成模块还用于分别将所述搜索词、相应的被标注为正例或负例的多个搜索结果条目的分词结果中最后一个分词对应在所述隐藏层的向量作为所述搜索词、所述相应的被标注为正例或负例的多个搜索结果条目的向量,利用所述向量计算所述搜索词分别与相应的被标注为正例或负例的多个搜索结果条目的相似度,将计算得到的各个相似度的值作为所述搜索排序模型的输出层。
18.根据权利要求11所述的训练装置,其特征在于,所述参数学习模块用于根据所述搜索词分别与相应的被标注为正例或负例的多个搜索结果条目的相似度建立损失函数,利用所述样本数据对所述损失函数进行训练,获取使得所述损失函数最小的所述基于Gated RNN的搜索排序模型的参数集合。
19.一种搜索处理装置,其特征在于,所述装置包括:
搜索词接收模块,用于接收用户的搜索词;
搜索结果条目获取模块,用于根据所述搜索词获取多个搜索结果条目;
排序分数获取模块,用于以所述搜索词和所述多个搜索结果条目作为输入,从经训练的基于Gated RNN的搜索排序模型中分别获取每个所述搜索结果条目的排序分数;
搜索结果条目排序模块,用于根据所述排序分数对所述多个搜索结果条目进行排序;
搜索结果条目发送模块,用于发送经排序的搜索结果条目。
20.根据权利要求19所述的装置,其特征在于,所述排序分数获取模块包括:参数获取单元,用于获取所述经训练的基于Gated RNN的搜索排序模型的参数,向量表示单元,用于根据所述参数将所述搜索词和所述多个搜索结果条目分别转换成向量表示,排序分数计算单元,用于根据由向量表示的所述搜索词和所述多个搜索结果条目分别计算所述搜索词和每个所述搜索结果条目之间的相似度值,并将与每个所述搜索结果条目对应的相似度值作为每个所述搜索结果条目的排序分数。