欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2017107924201
申请人: 广东石油化工学院
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-01-05
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于CNN-GRNN的读者情绪分布预测算法,其特征在于,包括如下步骤:

S1、将文本的多个句子合并为一个数据集,通过每个句子对应的矩阵计算句子特征向量;

S2、序列层:按上下文顺序从上到下依次对每个句子的句子特征向量进行迭代,每迭代一次就得到一个隐含层向量,并计算每个隐含层向量的注意力概率权重,将每个隐含层向量和相对应的注意力概率权重相乘后累加得到语义编码,再结合语义编码和最后迭代得到的隐含层向量进行聚合运算得到文本特征向量;

S3、设文本情绪标签数目为k,将文本特征向量转换成长度等于k的向量,通过回归模型得到文本的情绪标签分布。

2.根据权利要求1所述的读者情绪分布预测算法,其特征在于,在所述步骤S2中引入用于感知语义特征的上下文向量uc,通过该向量计算每个隐含层向量hi的注意力概率权重αi,具体公式为ui=tanh(Wahi+ba)及 其中,Wa和ba分别表示系数矩阵和偏置向量,Wa、ba和uc通过训练获得,L为隐含层向量的数量。

3.根据权利要求1所述的读者情绪分布预测算法,其特征在于,所述步骤S2中文本特征向量通过d=tanh(Wpv+WxhL)得到,其中hL表示最后迭代得到的隐含层向量,v表示语义编码,Wp和Wx是不同的系数矩阵,它们的值通过训练获得。

4.根据权利要求1所述的读者情绪分布预测算法,其特征在于,所述步骤S1可以分为输入层和句子特征提取层:S11、输入层:设数据集中句子的最大词数量n作为每一句的固定长度,句子中的每个词用词向量 至 表示,设词向量的维度为d,数据集中词数量不足n的句子,其中缺少的词向量从高斯分布中随机初始化,将数据集中每个句子用矩阵表示为S12、句子特征提取层:通过每个句子对应的矩阵计算句子特征向量。

5.根据权利要求4所述的读者情绪分布预测算法,其特征在于,所述步骤S12中的句子特征提取层包括卷积层和下采样层,每个句子对应的矩阵先后经过卷积层和下采样层后得出句子特征向量。

6.根据权利要求5所述的读者情绪分布预测算法,其特征在于,所述卷积层的步骤为:

设定不同大小的滤波器,分别对句子矩阵进行连续的卷积操作,每次连续的卷积操作后均得到多个特征映射数组;下采样层的步骤为:分别对所有特征映射数组进行采样,得到的多个局部最优特征值,并将其组合成句子特征向量。

7.根据权利要求6所述的读者情绪分布预测算法,其特征在于,所述卷积层的卷积操作具体为:在包含n个词向量的句子矩阵中,采用大小为h的滤波器进行卷积操作,其公式为yi=f(W·xi:i+h-1+b),其中yi表示特征映射数组中的第i个元素,xi:i+h-1代表h个词组成的局部单词窗口,其中,W为系数矩阵,b为偏置系数,它们的值通过训练获得。

8.根据权利要求1至7任一项所述的读者情绪分布预测算法,其特征在于,所述步骤S3中,通过softmax回归模型得到文本的情绪标签分布:p(x,θ)=softmax(Wsdx+bs);其中p是k维的多项式分布,分别表示k个情绪标签所占的比重,Ws和bs分别表示系数矩阵和偏置系数,它们的值通过训练集训练获得,dx指文本特征向量,x∈D,D为训练集,θ表示softmax回归模型中所要调整的参数。

9.根据权利要求8所述的读者情绪分布预测算法,其特征在于,softmax回归模型的损失函数为 求参数向量θ使损失函数J(θ)最小,其中设τ为训练集中设定好的读者情绪标签集合中任意

元素,pk(x,θ)用于对应每个不同τ的预测概率值,zk用于对应各个不同τ的真实概率值,为L2正则项。

10.根据权利要求1至7任一项所述的读者情绪分布预测算法,其特征在于,所述步骤S2中的迭代公式如下:其中st是当前输入的句子特征向量,ht-1是上一次迭代得到的隐含层向量,重置门限rt和更新门限zt控制每个隐含层向量的信息更新;Wz、Wr、Wh、Uz、Ur和Uh分别为不同的系数矩阵,bz、br和bh表示偏置向量,上述参数均通过训练获得。