欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2014107536448
申请人: 山东科技大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2023-12-11
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于老用户兴趣模型的电影个性化相似度计算方法,其特征在于,包括步骤:s1、基于某段时间T内的用户行为数据和该段时间内观影记录中评价最高的N部电影,建立用户动态行为信息库;

s2、对上述用户动态行为信息库进行数据挖掘,得到用户对电影各维度的偏好、以及用户对电影中各维度上特征值的偏好,构建用户兴趣模型;其中,(1)用户对电影各维度的偏好采用空间向量可表示为一个六元组,即:V={V1:w1,V2:w2,V3:w3,V4:w4,V5:w5,,V6:w6} (1.1)Vi表示电影的维度,wi表示用户对电影各个维度的权重,i∈[1,6],且通过对用户的搜索行为、条件查询行为的统计分析,以及对T段时间内用户高评分的N部电影的特征提取,挖掘用户在演员、导演、类型、地区、时间和内容简介六个维度不同的偏好程度,求得各维度权重wi;

(2)用户对电影中各维度上特征值的偏好可表示为:Vi={Tij:Wij} (1.2)式中,Tij为第i维度中的第j个特征值,Wij为第i维度中特征值j的权重,且通过用户的搜索行为,挖掘用户感兴趣的演员和导演信息,通过用户对类型、时间、地区不同条件下的筛选查看,挖掘用户对这三个维度上感兴趣的特征值信息;通过分析用户高评分的N条观影记录和收藏记录,提取电影各维度特征值信息;

综合以上分析,计算各维度各特征值的权重,即:

Vij=wi*Wij (1.3)

式中,Vij表示在第i维度中第j个特征值的兴趣度,i∈[1,6],j∈[1,n);

s3、通过用户兴趣模型对电影六个维度的分析,根据公式(1.4)计算电影A和电影B之间各维度的相似度,生成个性化电影相似度表;

式中,i∈[1,4],分别表示电影的演员、导演、类型、地区四个维度,j表示维度上特征值,Vij表示电影在第i个维度上第j个特征值的权重;

电影A和电影B在时间维度上的相似度计算公式为:

式中,Date表示当前的时间,DA表示电影A的发布时间,DB表示电影B的发布时间,min()表示取最小值,max()表示取最大值;

电影A和电影B在内容简介维度上的相似度计算公式为sim(M6A,M6B),利用Simhash算法计算得到;

s4、根据s2和s3中得到的各维度权重及其各维度相似度,利用公式(1.6)计算电影相似度:A B

式中,wi表示对应各维度的权重,sim(Mi,Mi)表示对应各维度的相似度,i∈[1,6]。

2.一种针对新用户的电影个性化相似度计算方法,其特征在于,包括如下步骤:s1、抽取每部电影的演员信息、导演信息、类型信息和地区信息、时间信息和内容简介信息,形成六维向量空间;

s2、基于用户显性信息对该用户做分类处理,找到与该用户最相似的簇群,运用统计学方法分析该人群在演员、导演、类型、地区、发布时间和内容简介六个维度上的平均偏好;

s3、基于电影自身内容特征,采用各维度加权求和的方法计算电影相似度,即:Sim=w1x1+w2x2+w3x3+w4x4+w5x5+w6x6 (2.1)式中,wi表示对应各维度的权重,i∈[1,6],此值通过步骤s2中的方法计算得到;xi分别表示演员、导演、类型、地区、发布时间五个维度的相似度,i∈[1,5],利用余弦相似度公式(2.2)计算得到:内容简介维度上的相似度值x6,则利用Simhash算法计算得到。