1.基于标签用户模型的信息检索方法,其特征在于,该方法包括以下步骤:
获取每个用户对各资源打上的标签;基于所述资源和对应的所述标签,构建各用户对应的资源标签二分图和资源标签节点;
基于所述资源标签节点,计算任意两两用户的用户相似度;基于所述用户相似度对所有用户进行聚类,得到多个用户标签类别和对应的多个用户标签类别中心用户;获取用户的各标签的使用频率;对于任意标签,基于所述使用频率对所有用户进行聚类,得到多个单标签类别和对应的多个单标签类别中心用户;
选取任意用户作为目标用户,选取任意标签作为目标标签,计算所述目标用户和对应的用户标签类别中心用户的类别距离;所述类别距离的倒数作为第一参考值;
基于所述目标标签,根据所述目标用户所属单标签类别内的使用频率计算第二参考值;当所述目标用户的目标标签对应的第一参考值大于第二参考值,将对应的用户标签类别中心用户作为参考用户;当所述目标用户的目标标签对应的第一参考值小于等于第二参考值,将对应的单标签类别中心用户作为参考用户;
将目标用户对应的参考用户的资源按照使用频率进行排序。
2.根据权利要求1所述的基于标签用户模型的信息检索方法,其特征在于,所述基于所述资源和对应的所述标签,构建各用户对应的资源标签二分图和资源标签节点,包括:对于任意用户,将资源和对应的标签进行连线,构建各用户对应的资源标签二分图;将资源和对应的所述标签进行标号,作为资源标签节点。
3.根据权利要求1所述的基于标签用户模型的信息检索方法,其特征在于,所述基于所述用户相似度对所有用户进行聚类,得到多个用户标签类别和对应的多个用户标签类别中心用户,包括:将用户相似度大于预设相似度阈值的用户分至同一个用户标签类别;对于任意所述用户标签类别,选取与类别内其他用户的用户相似度之和最大的用户作为用户标签类别中心用户;对于未分至用户标签类别内的未分组用户,计算所述未分组用户和各所述用户标签类别的用户标签类别中心用户的用户相似度,将所述未分组用户分至最大用户相似度对应的用户标签类别,多次迭代计算直至将所有所述未分组用户分至用户标签类别中,对应的迭代更新每个用户标签类别的用户标签类别中心用户。
4.根据权利要求1所述的基于标签用户模型的信息检索方法,其特征在于,所述对于任意标签,基于所述使用频率对所有用户进行聚类,得到多个单标签类别,包括:选取任意标签作为第一标签,基于各用户对所述第一标签的使用频率,利用多阈值分割得到多个类别,作为单标签类别。
5.根据权利要求1所述的基于标签用户模型的信息检索方法,其特征在于,所述选取任意用户作为目标用户,选取任意标签作为目标标签,计算所述目标用户和对应的用户标签类别中心用户的类别距离,包括:基于所述目标标签,当所述目标用户和对应的用户标签类别中心用户属于同一个单标签类别时,将零作为所述目标用户和对应的用户标签类别中心用户的类别距离;当所述目标用户和对应的用户标签类别中心用户不属于同一个单标签类别时,计算所述目标用户所属单标签类别内的使用频率的均值作为第一均值,计算对应的用户标签类别中心用户所属单标签类别内的使用频率的均值作为第二均值;所述第一均值和所述第二均值的差值作为所述目标用户和对应的用户标签类别中心用户的类别距离。
6.根据权利要求1所述的基于标签用户模型的信息检索方法,其特征在于,所述根据所述目标用户所属单标签类别内的使用频率计算第二参考值,包括:获取所述目标用户所属单标签类别的单标签类别中心用户对应的使用频率作为第一使用频率;获取所述目标用户所属单标签类别内的最大使用频率;所述第一使用频率和所述最大使用频率的比值为第二参考值。
7.根据权利要求1所述的基于标签用户模型的信息检索方法,其特征在于,所述将目标用户对应的参考用户的资源按照使用频率进行排序,包括:基于所述目标用户对应的参考用户的所有资源中的任意资源,获取所有参考用户的使用频率之和作为总使用频率;根据所述总使用频率对所有所述参考用户的资源进行排序。
8.根据权利要求1所述的基于标签用户模型的信息检索方法,其特征在于,所述用户相似度的计算方法为:计算任意两两用户对应的资源标签节点的交并比作为用户相似度。