1.一种基于极大无关多元逻辑回归的文本情感分类方法,其特征在于,所述方法包括:获取文本数据,并对所述文本数据进行预处理;所述文本数据包括训练数据和待预测数据;所述待预测数据包括多个文本条目;
在第一模型的代价函数基础上,通过引入相关参数惩罚项,获取第二模型的代价函数,包括:获取不相关约束项;
将预处理得到的训练数据输入第二模型的代价函数的导函数,并进行求解得到第二模型;所述第一模型为多元逻辑回归模型,所述第二模型为极大无关多元逻辑回归模型;
将预处理得到的待预测数据输入所述第二模型,得到待预测数据中每个文本条目所属的情感类别;
其中,所述第一模型为:
其中
所述不相关约束项为:
所述不相关约束项即相关参数惩罚项;其中,θi和θj为任意两组不同的参数。
2.根据权利要求1所述的方法,其特征在于,所述将预处理得到的待预测数据输入所述第二模型,得到待预测数据中每个文本条目所属的情感类别,包括:将预处理得到的待预测数据中的每个文本条目输入所述第二模型,得到每个文本条目的的文本情感类别概率;
设置分类阈值;
在文本条目的文本情感类别概率大于所述分类阈值时,判定所述文本条目属于第一情感类别;
在文本条目的文本情感类别概率小于等于所述分类阈值时,判定所述文本条目属于第二情感类别。
3.根据权利要求1或2所述的方法,其特征在于,所述在第一模型的代价函数基础上,通过引入相关参数惩罚项,获取第二模型的代价函数,还包括:获取第一模型的模型参数的负对数似然函数;
将不相关约束项引入第一模型的代价函数,得到第二模型的代价函数。
4.根据权利要求3所述的方法,其特征在于,所述第一模型的参数θ的负对数似然函数为:
所述负对数似然函数即第一模型的代价函数;其中,m为独立的样本的数目。
5.根据权利要求4所述的方法,其特征在于,所述第二模型的代价函数为:
6.根据权利要求5所述的方法,其特征在于,所述第二模型的代价函数的导函数为: