欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2019107515961
申请人: 浙江工业大学
专利类型:发明专利
专利状态:已下证
更新日期:2023-08-24
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于知识图谱病因初步诊断方法,其特征在于,包括以下步骤:步骤1:收集电子病历,构建原始数据集;

步骤2:从电子病历中进行实体识别与关系抽取,构建RDF格式的实体与关系数据集;

步骤3:构建基于上述数据集的知识图谱;

步骤4:构建通过知识图谱预测疾病之间关系的共生关系模型;

步骤5:基于共生关系模型对病因进行初步诊断,过程如下:

5.1)建立模型后输入RDF格式实体与关系数据集中的数据;

5.2)数据构建成知识图谱后,按照疾病名称送入共生关系模型,依据共生关系模型的MCCA值由高到低取前五个与该疾病共生的疾病;

5.3)根据步骤5.2所述,判断与疾病名称同时送入知识图谱的所有症状表征与A疾病是否存在关系;若在知识图谱中该疾病名称与所有症状表征中的若干症状表征之间不存在关系,则进一步判断若干症状表征与步骤5.2依据MCCA值所取的五个疾病名称是否存在关系;

假若关系仍不存在,则将其打上错误标记,以待更进一步审核。

2.如权利要求1所述的一种基于知识图谱病因初步诊断方法,其特征在于:所述步骤1中,编写所使用的电子病历,所述行为数据不包括私密数据,所收集电子病历均已进行脱敏操作。

3.如权利要求1或2所述的一种基于知识图谱病因初步诊断方法,其特征在于:所述步骤2中,根据步骤1中的收集的电子病历,进行实体识别与关系抽取,并以其构建RDF格式的实体与关系数据集。

4.如权利要求1或2所述的一种基于知识图谱病因初步诊断方法,其特征在于:所述步骤3中,知识图谱是由多个关系组成的图,其中每个节点表示实体,实体之间的对应关系用图中的边表示,构建基于电子病历数据集的知识图谱包括以下过程:

3.1)把RDF格式的数据集按照对应关系分为疾病名称,症状表征,用药种类及数量三类;

3.2)对上述三类数据进行格式标准化,包括文字编码统一以及标签分隔符统一;

3.3)将数据导入图数据库中,利用RDF自身特性构建知识图谱。

5.如权利要求1或2所述的一种基于知识图谱病因初步诊断方法,其特征在于:所述步骤4中,构建通过知识图谱预测疾病之间关系的共生关系模型包括以下过程:

4.1)图数据库天生具有RDF的特性,令图数据库中实体组的符号为ε,关系组的符号为R,RDF三元组的形式即为D+={(b,c,t)},其中b∈ε位于三元组头部位置,c∈R表示b与t的关系,t∈ε位于三元组的尾部,如果(e,c,e)∈D+(其中e∈ε),关系c与D+是相反的,如果(其中e1,e2∈ε),则称关系c是对称的,反之则非对称,如果(e1,c,e2)∈D+∧ (其中e1,e2,e3∈ε)则称关系c是可传递的;

4.2)根据上述数据背景,构建张量分解分解模型用于链路预测,其中模型对知识图谱中所有实体与关系进行嵌入,并将嵌入结果E(b),E(c),E(t)作为预测模型的输入;

4.3)对于所有实体e,E(e)其表现形式为Re(t)+Im(t)i,其中Re为数学中实数的符号表示,Im为虚数的符号表示,对于所有关系c,E(c)的表示形式为Re(c)+Im(c)i,故评分计算公式如下:其中j代表第j个元素;

如果改变尾部实体中Im的符号,嵌入将区分头部、尾部不同的实体并允许不对称建模,此嵌入的评分函数可比较方便的验证及扩展为以下公式:

4.4)利用上述公式使用交叉验证的方法进行预测实体之间的联系或边关系,为了评判共生疾病的关系是否密切,引入基于MRR指数的改进指数MRRA进行评估,MRRA计算公式如下:T代表所测试的三元组,rankb代表对于把b′∈ε的(b′,c,t)的三元组放入公式(2)中所计算得分数,rankt代表对于把t′∈ε的(b,c,t′)的三元组放入公式(2)中所计算得分数,MRRA分数高代表两个实体关系紧密,即两个病症可能共生。