欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 202210417839X
申请人: 山东师范大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-01-05
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.基于深度神经网络的中文命名实体识别方法,其特征在于,包括:提取待识别序列中的字符及单词,将字符与单词拼接成字符特征向量;

将拼接后的字符特征向量,输入到双向长短词记忆模型网络中,学习上下文信息,得到上下文特征向量;

空洞卷积网络学习上下文特征向量中的语义信息,得到语义特征向量;

将上下文特征向量和语义特征向量拼接,获得融合后的数据特征,自注意力层对数据特征提取长距离依赖,得到注意力重要度特征向量;

条件随机场解码注意力重要度特征向量,获得识别标签。

2.如权利要求1所述的基于深度神经网络的中文命名实体识别方法,其特征在于,所述单词的提取,采用前向匹配和后向匹配相结合的方式识别序列中的单词。

3.如权利要求2所述的基于深度神经网络的中文命名实体识别方法,其特征在于,单词提取时,对获取的待识别序列,以序列的长度为最大长度,从左到右或从右到左进行匹配,找出每个字符在序列中的所有单词,如果没有匹配到,就用0去填充。

4.如权利要求1所述的基于深度神经网络的中文命名实体识别方法,其特征在于,双向长短词记忆模型网络,通过记忆门、遗忘门和输出门学习特征之间的长短期依赖关系,分别采用正向和逆向计算,将得到的正向特征和逆向特征,通过向量拼接的方式得到上下文特征向量。

5.如权利要求1所述的基于深度神经网络的中文命名实体识别方法,其特征在于,空洞卷积网络,用指数级的扩展宽度进行扩张宽度卷积层,完成四次迭代的完整卷积运算,得到语义特征。

6.如权利要求1所述的基于深度神经网络的中文命名实体识别方法,其特征在于,自注意力层,获取融合后的数据特征的Value值、Key值以及查询Query权重矩阵,归一化处理后,通过注意力重要函数得到最终的注意力重要度特征向量。

7.如权利要求1所述的基于深度神经网络的中文命名实体识别方法,其特征在于,得到注意力重要度特征向量之后,与条件随机场设置的状态转移矩阵相加,得到相应的预测分数,通过遍历比较候选集中所有可能的标签的分数,选取最大的分数对应的标签做为最终的识别标签。

8.基于深度神经网络的中文命名实体识别系统,其特征在于:包括单词提取模块、上下文特征提取模块、语义特征提取模块、自注意力模块和标签识别模块;

所述单词提取模块,用于提取待识别序列中的字符及单词,将字符与单词拼接成字符特征向量;

所述上下文特征提取模块,用于将拼接后的字符特征向量,输入到双向长短词记忆模型网络中,学习上下文信息,得到上下文特征向量;

所述语义特征提取模块,用于空洞卷积网络学习上下文特征向量中的语义信息,得到语义特征向量;

所述自注意力模块,用于将上下文特征向量和语义特征向量拼接,获得融合后的数据特征,自注意力层对数据特征提取长距离依赖,得到注意力重要度特征向量;

所述标签识别模块,用于条件随机场解码注意力重要度特征向量,获得识别标签。

9.一种计算机可读存储介质,其上存储有程序,其特征在于,该程序被处理器执行时实现如权利要求1‑7任一项所述的基于深度神经网络的中文命名实体识别方法中的步骤。

10.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,其特征在于,所述处理器执行所述程序时实现如权利要求1‑7任一项所述的基于深度神经网络的中文命名实体识别方法中的步骤。