欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2019114092853
申请人: 西安理工大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2023-12-04
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于图数据库的建筑设计规范知识图谱构建方法,其特征在于,具体按照如下步骤实施:

步骤1,抽取待处理存储规范中的全部实体,构建规范语义存储实体集合Entity_Set1{E1,E2,E3,…};

步骤2,对步骤1所得实体集合Entity_Set1{E1,E2,…,E3}进行聚类去重操作,得到去重后的实体集合Entity_Set3;

步骤3,建立普通节点表格文件,以“Name”为第一列首行单元格值,以“单位”为第二列首行单元格值,以“:LABEL”为第三列首行单元格值,以“:ID”为第四列首行单元格值,然后将实体集合Entity_Set3中各实体Ei填入普通节点表格文件中,i=1,2,3……;

步骤4,建立特殊节点表格文件,分别以“Name”,“:LABEL”,“:ID”为首行第一至三列单元格值;

步骤5,建立节点关系表格文件,分别以“:START_ID”,“:END_ID”,“Start”,“End”,“Flag”,“IDD”,“:TYPE”为首行第一至七列单元格值,节点关系表中从第二行起,各行依次分别存储一条实体关系,每增加一则关系,便为该关系所在行“IDD”列单元格填入An,其中,n为已存储关系数;

步骤6,针对具体规范条文,将步骤5建立的节点关系表首行紧后一列单元格值设置为该规范条文编号,对于具有二级编号的规范条文,则将各二级条文分作一列;

步骤7,分析梳理当前规范条文中各实体间谓词关系,分别在普通节点表格文件中查找本规范条文中有关实体Ei所对应“:ID”列单元格值,记为Ei_ID,i=1,2,3……;

步骤8,依次对规范中各规范条文按照步骤6进行表达与存储;

步骤9,将普通节点表格文件、特殊节点表格文件、节点关系表格文件采用UTF‑8编码方式,以.CSV文件格式进行存储,以便导入Neo4j数据库;

步骤10,借助Neo4j‑import工具,将上述.CSV文件依照普通节点表,特殊节点表,节点关系表的顺序,按照Neo4j数据批量导入格式,依次导入Neo4j数据库,从而完成建筑设计所涵盖规范语义信息的图结构存储与表达。

2.根据权利要求1所述的一种基于图数据库的建筑设计规范知识图谱构建方法,其特征在于,所述步骤2具体为:

步骤2.1,将语义表达相近的实体进行聚类,统一抽象为相应实体,得到实体集合Entity_Set2;

步骤2.2,去除实体集合Entity_Set2中的重复实体,得到实体集合Entity_Set3。

3.根据权利要求1所述的一种基于图数据库的建筑设计规范知识图谱构建方法,其特征在于,所述步骤3中将实体集合Entity_Set3中各实体Ei填入普通节点表格文件中具体为:

步骤3.1,将实体集合Entity_Set3中各实体Ei依次作为普通节点表格第一列第i+1行单元格值,i=1,2,3……;

步骤3.2,若实体Ei为带有单位的数字实体,则仅将数字实体作为第一列第i+1行单元格值,将其计量单位保存于第二列同行单元格;

步骤3.3,依次以所处理规范中涉及实体Ei的规范条文编号为第i+1行单元格值,若实体Ei涉及多条规范,则各规范编号间以“;”分隔;

步骤3.4,将第四列第i+1行单元格值设置为i,i=1,2,3……,直至i等于实体集合Entity_Set3中实体总数。

4.根据权利要求1所述的一种基于图数据库的建筑设计规范知识图谱构建方法,其特征在于,所述步骤7具体为:

步骤7.1,若某实体Ei与自身存在一元谓词关系,则将实体Ei所对应Ei_ID分别填入“:START_ID”和“:END_ID”所在列紧后行空白单元格,记所处行数为y,以该一元谓词关系为第y行“:TYPE”列单元格值;

步骤7.2,若该一元谓词关系同时包含约束程度关系,则将约束程度词填入第y行当前处理规范条文编号所在列单元格,否则该单元格以“ ”填充;

步骤7.3,若该规范条文中存在某实体Ej到该一元谓词整体间的二元谓词关系,则按照如下操作步骤进行:

步骤7.3.1,若特殊节点表格文件中已存在“:LABEL”列某单元格值为“简单节点”及当前规范条文编号,则仅需记该单元格所在行“:ID”列单元格值为Ori_ID;

步骤7.3.2,若特殊节点表格文件中不存在“:LABEL”列某单元格值为“简单节点”及本规范条文编号,则按照步骤7.3.3至步骤7.3.5进行;

步骤7.3.3,为特殊节点表“Name”列紧后一行空白单元格填入“ ”占位;

步骤7.3.4,将“简单节点”及当前规范条文编号填入同行“:LABEL”列单元格,其间以“;”分隔;

步骤7.3.5,将同行“:ID”列单元格值设置为当前普通节点数与特殊节点数之和,记为Ori_ID;

步骤7.3.6,将实体Ej所对应Ej_ID填入节点关系表中“:START_ID”列紧后一行空白单元格,记行号为y;

步骤7.3.7,将该一元谓词关系所包含实体Ei所对应Ei_ID填入第y行“:END_ID”列单元格;

步骤7.3.8,以该二元谓词关系为第y行“:TYPE”列单元格值;

步骤7.3.9,若该二元谓词关系同时存在约束程度关系,则将约束程度词作为第y行当前规范编号列单元格值;若不存在约束程度关系,则该单元格以“ ”占位;

步骤7.3.10,将Ori_ID填入第y+1行“:START_ID”列单元格;

步骤7.3.11,将Ei_ID填入第y+1行“:END_ID”列单元格;

步骤7.3.12,以“简单边”为第y+1行“:TYPE”列单元格值;

步骤7.3.13,以该一元谓词关系所在行“IDD”列单元格值为第y+1行“Start”列单元格值;

步骤7.3.14,以第y行“IDD”列单元格值为第y+1行“End”列单元格值;

步骤7.4,若该规范条文存在某实体Ei到另一实体Ej间的二元谓词关系,则将实体Ei所对应Ei_ID填入“:START_ID”所在列紧后行空白单元格,记所处行数为y,将实体Ej所对应Ej_ID填入第y行“:END_ID”列单元格,以该二元谓词关系为同行“:TYPE”列单元格值;

步骤7.5,若该二元谓词关系同时包含约束程度关系,则将约束程度词填入第y行当前处理规范条文编号所在列单元格,否则该单元格以“ ”填充;

步骤7.6,若该规范条文中某三个实体Ei、Ej、Ek间存在三元谓词关系Tri,则按照如下操作进行:

步骤7.6.1,若特殊节点表格文件中已存在“Name”列某单元格值为该三元谓词关系,则仅需为此单元格同行“:LABEL”列添加本规范条文编号,与原单元格值采用“;”分隔,并记同行“:ID”列单元格值为Tri_ID;

步骤7.6.2,若特殊节点表格文件中不存在“Name”列某单元格值为该三元谓词关系,则按照步骤7.6.3至步骤7.6.5进行;

步骤7.6.3,为特殊节点表“Name”列紧后一行空白单元格填入该三元谓词关系;

步骤7.6.4,将“复杂节点”及当前规范条文编号填入同行“:LABEL”列单元格,其间以“;”分隔;

步骤7.6.5,将同行“:ID”列单元格值设置为当前普通节点数与特殊节点数之和,记为Tri_ID;

步骤7.6.6,将实体Ei、Ej、Ek所对应Ei_ID、Ej_ID、Ek_ID分别填入节点关系表格文件中“:START_ID”列紧后一行空白单元格,将Tri_ID填入此三行中各行“:END_ID”列单元格;

步骤7.6.7,以该三元谓词关系为此三行中各行“:TYPE”列单元格值;

步骤7.6.8,依据实体Ei、Ej和Ek在该三元谓词关系中语义逻辑顺序,设置此三行中各行当前规范条文编号所在列单元格值为Seq,Seq=1,2,3;

步骤7.7,若该规范条文中某实体Ei与某三元谓词Trj整体间存在二元谓词关系,则按照以下步骤进行:

步骤7.7.1,依据该二元谓词关系中实体Ei和三元谓词Trj的语义逻辑次序,将节点关系表中“:START_ID”列紧后一行空白单元格值设置为Ei_ID或Trj_ID,以标记关系引出节点,将同行“:END_ID”列单元格值设置为另一值,以标记关系指向节点;

步骤7.7.2,以该二元谓词关系为同行“:TYPE”列单元格值;

步骤7.7.3,若该二元谓词关系同时存在约束程度关系,则将约束程度词作为第y行当前规范编号列单元格值;若不存在约束程度关系,则该单元格以“ ”占位;

步骤7.8,若当前规范实体集合Entity_Set3中某实体Ei,其存在到本规范中一个以上实体间的二元谓词关系,且此多个实体间或实体所处简单句间存在“且”或“或”的语义逻辑关系,则进行其间二元谓词关系存储后,按照如下步骤进行其间语义逻辑关系的表示:步骤7.8.1,若特殊节点表格文件中已存在“:LABEL”列某单元格值为“选择节点”及当前规范条文编号,则仅需记该单元格所在行“:ID”列单元格值为Dri_ID;

步骤7.8.2,若特殊节点表格文件中不存在“:LABEL”列某单元格值为“选择节点”及本规范条文编号,则按照步骤7.8.3至步骤7.8.5进行;

步骤7.8.3,为特殊节点表“Name”列紧后一行空白单元格填入“ ”占位;

步骤7.8.4,将“选择节点”及当前规范条文编号填入同行“:LABEL”列单元格,其间以“;”分隔;

步骤7.8.5,将同行“:ID”列单元格值设置为当前普通节点数与特殊节点数之和,记为Dri_ID;

步骤7.8.6,将Dri_ID作为节点关系表格文件中“:START_ID”列紧后一行空白单元格值,记所处行数为y;

步骤7.8.7,将Ei_ID填入第y行“:END_ID”列单元格;

步骤7.8.8,在实体关系表中依次查找当前规范条文中由Ei_ID作为“:START_ID”列单元格值,且具有相同语义逻辑关系的二元谓词所在行“IDD”列单元格值,以该值为实体关系表中第y行“Flag”列单元格值,各值间以“;”分隔;

步骤7.8.9,依据各二元谓词间的语义逻辑关系,以“且”或“或”作为第y行“:TYPE”列单元格值;

步骤7.8.10,第y行当前规范编号所在列单元格值设为“ ”占位;

步骤7.8.11,若当前规范条文中,以Ei为节点关系表中“:START_ID”列单元格值所在行所存储的二元谓词关系间存在不止一种语义逻辑关系,则重复步骤7.8.6至步骤7.8.10;

步骤7.8.12,若当前规范条文有且仅有一个实体Ei存在到本规范中一个以上实体间的二元谓词关系,且二元谓词关系皆为同一语义逻辑关系类型,则完成此条规范条文的图结构表达与存储,否则,按照步骤7.8.13至步骤7.8.16进行;

步骤7.8.13,抽取当前规范条文中各简单句Sj组成子句集合Sentence_Set{S1,S2,S3……};

步骤7.8.14,分别以子句集合Sentence_Set中各子句Sj首个实体Ej所对应Ej_ID依次为节点关系表中“:END_ID”列紧后行空白单元格值,记行号为yj;

步骤7.8.14,以Dri_ID为节点关系表第yj行“:START_ID”列单元格值;

步骤7.8.15,以“子句”为节点关系表第yj行“:TYPE”列单元格值;

步骤7.8.16,通过查找节点关系表格文件,抽取本规范条文中具有一个以上出度的实体节点,依次以各实体节点所引出,且表示当前子句Sj中的谓词关系所在行的“IDD”列单元格值为节点关系表第yj行“Flag”列单元格值,各值间采用“,”分隔。

5.根据权利要求4所述的一种基于图数据库的建筑设计规范知识图谱构建方法,其特征在于,所述步骤7.8中一个以上实体、多个实体、实体所处简单句间存在“且”或“或”的语义逻辑关系以及步骤7.8.12中的一个以上实体中的实体指一元谓词整体或三元谓词整体。