欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2018103323385
申请人: 重庆邮电大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-02-23
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于极大无关多元逻辑回归的文本情感分类方法,其特征在于,所述方法包括:获取文本数据,并对所述文本数据进行预处理;所述文本数据包括训练数据和待预测数据;所述待预测数据包括多个文本条目;

在第一模型的代价函数基础上,通过引入相关参数惩罚项,获取第二模型的代价函数,包括:获取不相关约束项;

将预处理得到的训练数据输入第二模型的代价函数的导函数,并进行求解得到第二模型;所述第一模型为多元逻辑回归模型,所述第二模型为极大无关多元逻辑回归模型;

将预处理得到的待预测数据输入所述第二模型,得到待预测数据中每个文本条目所属的情感类别;

其中,所述第一模型为:

其中

所述不相关约束项为:

所述不相关约束项即相关参数惩罚项;其中,θi和θj为任意两组不同的参数。

2.根据权利要求1所述的方法,其特征在于,所述将预处理得到的待预测数据输入所述第二模型,得到待预测数据中每个文本条目所属的情感类别,包括:将预处理得到的待预测数据中的每个文本条目输入所述第二模型,得到每个文本条目的的文本情感类别概率;

设置分类阈值;

在文本条目的文本情感类别概率大于所述分类阈值时,判定所述文本条目属于第一情感类别;

在文本条目的文本情感类别概率小于等于所述分类阈值时,判定所述文本条目属于第二情感类别。

3.根据权利要求1或2所述的方法,其特征在于,所述在第一模型的代价函数基础上,通过引入相关参数惩罚项,获取第二模型的代价函数,还包括:获取第一模型的模型参数的负对数似然函数;

将不相关约束项引入第一模型的代价函数,得到第二模型的代价函数。

4.根据权利要求3所述的方法,其特征在于,所述第一模型的参数θ的负对数似然函数为:

所述负对数似然函数即第一模型的代价函数;其中,m为独立的样本的数目。

5.根据权利要求4所述的方法,其特征在于,所述第二模型的代价函数为:

6.根据权利要求5所述的方法,其特征在于,所述第二模型的代价函数的导函数为: