1.一种基于症状特征的疾病知识图谱检索方法,其特征在于,包括以下步骤:S1、对输入文本进行预处理,得到规范文本;
S2、对规范文本提取症状特征;
S3、在图谱中检索与符合症状特征的疾病节点;
S4、计算全部疾病节点与症状特征的相关度;
S5、对全部疾病节点进行分类,按相关度降序,得到检索结果。
2.根据权利要求1所述的基于症状特征的疾病知识图谱检索方法,其特征在于,所述步骤S1具体为:
A1、将图谱中所有症状节点的“别名”属性值在文本中进行完全字符串匹配,将匹配得到的症状别名替换成该别名同一症状实体下的“标准名称”属性值;
A2、采用字符识别算法将文本中的汉字数字进行识别,转换为阿拉伯数字。
3.根据权利要求1所述的基于症状特征的疾病知识图谱检索方法,其特征在于,所述步骤S2包括以下步骤:
S21、对规范文本提取时间点,将规范文本拆分为有关段、无关段和各时间段;
S22、将时间段中的有关症状与时间点进行绑定,得到有关症状特征;
S23、将有关症状特征与无关症状特征进行合并,得到文本中的完整症状特征。
4.根据权利要求1所述的基于症状特征的疾病知识图谱检索方法,其特征在于,所述步骤S4中相关度的计算公式为:
其中,Rd,s为疾病节点d与症状特征的相关度,si为症状节点集合S=[s1,s2,…,si,…,sn]的元素,d为疾病节点,n为疾病节点对应的所有症状数,L(d,si)为疾病节点d,症状节点si的症状类型,所述症状类型包括:典型症状、常见症状、一般症状和罕见症状,四个症状类型具有固定分值:W典型症状、W常见症状、W一般症状和W罕见症状;Rd,s=典型症状分值和+常见症状分值和+一般症状分值和+罕见症状分值和。
5.根据权利要求4所述的基于症状特征的疾病知识图谱检索方法,其特征在于,所述典型症状分值和、常见症状分值和、一般症状分值和罕见症状分值和满足如下约束:MAX(典型症状分值和)>MAX(常见症状分值和)>MAX(一般症状分值和)>MAX(罕见症状分值和)。
6.根据权利要求1所述的基于症状特征的疾病知识图谱检索方法,其特征在于,所述步骤S5具体为:将全部疾病节点根据医学领域特征进行分类,得到各科室、各类型疾病,并按相关度作降序排列,生成多维检索结果。