欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2016100339749
申请人: 杭州电子科技大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-01-05
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.基于评论情感分析和协同过滤的评分预测方法,其特征在于该方法的具体步骤是:

步骤(1).对训练集中的每一条评论进行文本预处理,首先,使用Punkt语句分割器将文本分句,再将每个句子分词,然后移除所有停用词和长度超过50的句子,最后使用Porter词干提取算法提取所有单词的词干;

步骤(2).将训练数据读入计算机内存,包括用户ID、项目ID、评分、预处理后的评论文本、评分时间;

步骤(3).初始化参数,包括全局偏置μ、用户偏置bu、项目偏置bv、用户潜在因子向量pu、项目潜在因子向量qv、方面单词向量ψ、潜在因子到方面分布转换峰度系数 评分到情感分布的转换平滑系数ω,并随机分配句子的方面和情感标签e,z;

步骤(4).使用L-BFGS最优化算法最小化损失函数 得到新的参数

集合Θ,ψ, ω,并通过项目潜在因子到方面分布的转换、评分到情感分布的转换和方面单词向量到方面单词分布的转换将项目潜在因子向量qv、项目平均评分 和方面单词向量ψ转换为方面分布θ、情感分布π和方面单词分布 其中Θ为潜在因子模型参数集,Φ为方面情感统一模型参数集, 为控制转换的峰度系数;

步骤(5).使用步骤(4)中转换后的方面分布θ、情感分布π和方面单词分布 计算评论文本语料库中每个评论中每个语句属于不同方面和情感的概率 并通过该概率采样语句新的方面标签z和情感标签e,其中ed,i为文档d第i个句子的情感标签,zd,i为文档d第i个句子的方面分配;

步骤(6).重复步骤(4)和步骤(5)直至损失函数不再降低,得到最终的预测参数,包括全局偏置μ、用户偏置bu、项目偏置bv、用户潜在因子向量pu和项目潜在因子向量qv;

步骤(7).使用训练后的参数全局偏置μ、用户偏置bu、项目偏置bv、用户潜在因子向量pu和项目潜在因子向量qv预测用户对项目的评分。