欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2019106297404
申请人: 杭州电子科技大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-02-26
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于记忆网络的文本情感分类方法,其特征在于包括如下步骤:步骤(1)对文本进行分词;

步骤(2)对分词后的文本,进行词向量嵌入,得到文本词向量;

步骤(3)把文本词向量输入到自注意力模型中,得到文本特征;

步骤(4)使用记忆网络模型多次对文本特征进行情感特征的提取,输出最后的分类结果。

2.根据权利要求1所述的一种基于记忆网络的文本情感分类方法,其特征在于步骤(1)所述对文本分词的过程如下:

1-1.确定文本的所属领域,人工搜集所属领域的相关词汇;

1-2.将步骤1-1中搜集的词汇和对应领域的公共词汇数据库进行合并,获得自定义领域词典;

1-3.根据当下通用的停用词,并结合对应领域,构建领域词典的停用词词典;

1-4.使用专业的中文分词工具,对文本进行分词,得到的文本的分词结果。

3.根据权利要求1或2所述的一种基于记忆网络的文本情感分类方法,其特征在于步骤(2)所述的对分词后的文本,进行词向量嵌入,得到文本词向量的详细过程如下:

2-1.使用word2vec工具训练分词后的文本来获得文本词向量,得到一个embedding的文件;embedding用于存放文本词向量;

2-2.根据步骤1中得到的文本的分词结果,使用embedding进行文本词向量的训练,获得新的文本词向量Ⅰ。

4.根据权利要求1所述的一种基于记忆网络的文本情感分类方法,其特征在于步骤(3)所述的把文本词向量输入到自注意力模型中,得到文本特征的过程如下:

3-1.将文本词向量Ⅰ输入到自注意力模型中获得上下文相关的文本特征。

5.根据权利要求4所述的一种基于记忆网络的文本情感分类方法,其特征在于步骤(4)所述的使用记忆网络模型多次对文本特征进行情感特征的提取,输出最后的分类结果,过程如下:

4-1.进行关键情感信息的抽取:

μ=[F*q*;|F-q*|;F*mt-1;|F-mt-1|]   (1)其中,F表示文本,q*表示描述文本的某一个方面情感问句,“;”表示向量连接,“*、-、| |”分别表示向量点乘、减法和绝对值;Hc表示文本的长度,F词向量的形状为[1,Hc],Hq表示情感问句的长度,Hm表示记忆网络的记忆向量,q*和mt-1的形状分别为[1,Hq]和[1,Hm];

4-2.将记忆网络模型的输出mt输入到softmax函数,输出最终的分类结果。

6.根据权利要求5所述的一种基于记忆网络的文本情感分类方法,其特征在于步骤4-2的详细过程:记忆网络模型具有三个组件:注意门、特征转换部分和存储器更新门,记忆网络模型用于将F与q*结合,提取出与文本情感相关的文本特征;

将α中的第i个元素作为 的注意权重,通过使用双层感知器变换μ获得α:其中, 和 是双层感知器的参数;

特征转换部分将F和α作为输入,然后获得更新后的F′:F=F·α

记忆更新门使用情感问句q*,先前的记忆向量mt-1和更新后的F‘输出更新的记忆向量mt:mt=relu([q*;mt-1;F′]·Wu)其中,Wu是线性层的参数;

每次迭代记忆网络模型都使用α来过滤无关的情感信息,记忆网络模型在最后一次迭代时产生mt作为记忆网络模型的最终输出。