欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2020105042330
申请人: 东北电力大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2023-12-11
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于内容地图的科技文献内容深度揭示方法,其特征在于,包括:对文本数据进行知识对象及其语义关系提取;

多篇科技文献内容地图的构建;

科技文献内容知识深度聚合;

所述对文本数据进行知识对象及其语义关系提取包括:步骤1:输入准备好的文本数据集;

步骤2:对文本数据中非结构化的实验数据进行人工标注,将其转化为结构化的数据;

包括对每篇文本标注文本标号、标题、摘要,标识每个句子的位置及编号,同时将摘要内容细化为目的、方法、结果及结论;

步骤3:对文本数据进行预处理,是利用停用词表删除无用知识对象;

步骤4:利用工具ClausIE对处理好的文本数据进行知识对象句法三元组提取,并存储;

步骤5:对提取得到的句法三元组进行处理;

步骤6:借助领域语义词典,将步骤5中处理好的不完整句法三元组与领域语义词典进行匹配,寻找头实体与尾实体的语义关系将其补充完整,将补充完整的三元组作为语义三元组,并将其存储;

步骤7:将每一条处理好的带有位置信息的语义三元组和句法三元组存储在一起,由此构成所需要的数据集—语义集SS,作为构建多篇科技文献内容地图的数据;科技文献内容知识对象及其关系提取完毕,语义集合构建完成;

所述多篇科技文献内容地图的构建包括:

多篇科技文献内容地图构建流程和多篇科技文献内容地图构建算法;

所述多篇科技文献内容地图构建流程包括:

步骤1:收集同一主题的科技文献若干篇,建立文献集,依次作为原始数据;

步骤2:借助领域词典将文献集中的核心术语及其之间的语义关系及语义元素进行提取;

步骤3:将提出的原始语义元素在语义结构进行拆解操作,得到基础语义元素,并将这些基础的语义元素进行搅拌;

步骤4:将这些被打散的基础语义元素依据其内部存在的语义逻辑关系进行重组,形成语义集合;

步骤5:构建新的语义结构和语义特征,形成内容地图,科技文献的主要内容地图构建完毕;

所述多篇科技文献内容地图构建算法包括:

步骤1:输入提取处理好的语义集SS;

步骤2:分别对语义集SS中语义三元组的数量、语义关系的数量、每个知识对象出现的次数、所有知识对象出现次数的总数进行统计,然后利用公式(1)计算每个知识对象的频次,                       (1)式中: 表示知识对象t在语义集SS中出现的次数, 表示语义集SS中所有知识对象出现的次数总数;

步骤3:将语义集SS中频次最高的知识对象A排入科技文献内容地图中,作为科技文献内容地图生成的第一批点;

步骤4:将语义集SS所有包含知识对象A的语义三元组抽取出来放入一个空语义集中,建立语义集SSA;

步骤5:计算语义集SSA中知识对象的重要度,并根据其重要度进行排序,进行知识对象重要度计算;

步骤6:按照语义集SSA中知识对象的重要度,将知识对象排入科技文献内容地图中;

步骤7:判断语义子集SSA是否为空,若语义子集SSA为空则执行步骤8,若语义子集SSA不为空,则转到步骤6;

步骤8:依据语义集SSA中知识对象的重要度到语义集SS中依次提取语义集SSB、语义集SSC、语义集SSD…,并对每一个语义子集执行步骤5‑步骤7;

步骤9:判断语义集SS是否为空,若语义集SS为空则执行步骤10,若语义集SS不为空,则转到步骤8;

步骤10:输出多篇科技文献内容地图;

所述科技文献内容知识深度聚合包括:

借助已构建完成的内容地图进行文献间隐性知识发现和知识间的推理,在平面空间内,从知识对象、语义关系、数量统计的维度生成跨文献的知识簇;在立体空间中,以知识对象为目标,以语义关系为线索进行深层次探索并生成跨文献的知识链;

通过对构建完成的多篇科技文献内容地图进行语义分析,根据路径长度的不同可以在广度和深度两个方面对知识进行关联;在立体空间内,选定某一知识对象为起点,选定路径长度,以语义关系为线索进行深层次关联,由此可以得到以此知识对象为起点的不同知识对象间直接或者间接关联的多条重要事实,即跨文献知识链的生成。