欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 202110474668X
申请人: 山东师范大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-01-05
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种医疗命名实体识别方法,其特征在于:包括以下过程:获取待识别的医疗文本数据;

根据获取的医疗文本数据,得到至少一个句子中的词嵌入向量;

进行句子中短语的语法角色标记,结合短语之间的依存关系,得到短语之间的关系图,根据预设图卷积神经网络中,得到特征向量;

将获取的词嵌入向量和特征向量进行拼接,得到拼接后的输入向量;

根据拼接后的输入向量和预设动态堆叠网络,得到医疗命名实体识别结果;

其中,所述动态堆叠网络中,根据句子的嵌套层数确定Transformer‑CRF层的叠加数量;

将短语定义为结点,将短语之间的依存关系定义为边,利用图卷积神经网络通过所述关系图上操作聚集结点的邻域特征;

如果只有一层卷积,则捕获直接邻居节点特征,如果具有多层卷积堆叠卷积层,则捕获最多K跳跃的任何结点特征。

2.如权利要求1所述的医疗命名实体识别方法,其特征在于:如果当前Transformer‑CRF层预测到实体,则引入一个新的Transformer‑CRF层,结合当前Transformer‑CRF层检测到的每个实体的单词序列表示,组成该实体的新表示,然后将其作为输入传递到新的Transformer‑CRF层。

3.如权利要求1所述的医疗命名实体识别方法,其特征在于:动态堆叠网络中,如果当前Transformer‑CRF层检预测到非实体,则保留字符表示而不进行任何处理。

4.如权利要求1所述的医疗命名实体识别方法,其特征在于:短语之间的依存关系分析时没有非终结符,词与词相互依存,两个词分别为核心词和从属词,用有向弧表示,弧的方向为核心词指向从属词,弧上的标记为依存关系类型。

5.如权利要求1所述的医疗命名实体识别方法,其特征在于:利用XLnet语言模型进行词向量的获取,且XLnet语言模型采用双流注意力机制。

6.一种医疗命名实体识别系统,其特征在于:包括:数据获取模块,被配置为:获取待识别的医疗文本数据;

词嵌入向量获取模块,被配置为:根据获取的医疗文本数据,得到至少一个句子中的词嵌入向量;

特征向量提取模块,被配置为:进行句子中短语的语法角色标记,结合短语之间的依存关系,得到短语之间的关系图,根据预设图卷积神经网络中,得到特征向量;

向量拼接模块,被配置为:将获取的词嵌入向量和特征向量进行拼接,得到拼接后的输入向量;

实体识别模块,被配置为:根据拼接后的输入向量和预设动态堆叠网络,得到医疗命名实体识别结果;

其中,所述动态堆叠网络中,根据句子的嵌套层数确定Transformer‑CRF层的叠加数量;

将短语定义为结点,将短语之间的依存关系定义为边,利用图卷积神经网络通过所述关系图上操作聚集结点的邻域特征;

如果只有一层卷积,则捕获直接邻居节点特征,如果具有多层卷积堆叠卷积层,则捕获最多K跳跃的任何结点特征。

7.一种计算机可读存储介质,其上存储有程序,其特征在于,该程序被处理器执行时实现如权利要求1‑5任一项所述的医疗命名实体识别方法中的步骤。

8.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,其特征在于,所述处理器执行所述程序时实现如权利要求1‑5任一项所述的医疗命名实体识别方法中的步骤。