1.一种交通事故报告提取与场景类型推理方法,其特征在于,包括:对交通事故场景的实体进行分类,对V2V事故领域本体进行构建;
对交通事故报告进行数据预处理;
对数据预处理后的交通事故报告进行事故信息提取,获取事故场景的具体信息;
推理得到本体中隐含的其他关联结构,输出结构化场景信息所对应的场景类型;
在所述对交通事故场景的实体进行分类,对V2V事故领域本体进行构建的步骤中,设计出V2V事故领域本体的类属结构、对象属性和若干实例,通过OWL语言和本体构建工具对基本体进行构建;V2V事故领域的核心本体包括以下模块:Vehicle、Obstacle、ObjectBehavior、Environment、Road NetWork和Accident Scenario Type;其中,Vehicle描述主要的交通参与者;Obstacle通过其状态分为两种对象:静态障碍物和动态障碍物;所述的Obstacle和Vehicle通过抽取出共同的行为属性,衍生出Object Behavior,用于描述实体的行为动作;Environment作为事故场景中的环境要素,描述天气状态和光照条件;RoadNetWork作为描述道路路网的模块,包含路网形状及其物理结构;Accident Scenario Type是事故场景类别模块,标识事故场景的类型;
所述对数据预处理后的交通事故报告进行事故信息提取的具体步骤包括:定义一个特定领域词典,然后通过正则匹配,将报告中满足匹配条件的特定词汇“A”和“B”,转换成“A-B”的形式,使之成为一个整体;
将文本中的指代词还原为其原本所指代的对象;
进行句子边界检测,将文本转换为若干的单句;
利用自然语言处理工具包对非结构化的事故报告进行依存分析,获得句子中词与词之间的依存关系。
2.根据权利要求1所述交通事故报告提取与场景类型推理方法,其特征在于:所述对交通事故报告进行数据预处理的内容包括特定领域词汇处理、指代消解、句子边界检测以及依存关系分析;对于V2V事故领域的核心本体设置如表1所示对象关联结构以及如表2所示数据关联结构:表1
表2
。
3.根据权利要求1所述交通事故报告提取与场景类型推理方法,其特征在于:在所述对数据预处理后的交通事故报告进行事故信息提取的步骤中,对数据预处理后的交通事故报告经过本体解析后,依据提取规则对信息进行提取。
4.根据权利要求1所述交通事故报告提取与场景类型推理方法,其特征在于,所述获取事故场景的具体信息的步骤包括:本体解析,导入实体中的类、属性关系、实例信息;
导入交通事故报告经关系抽取模块后的分析结果,包含经分组处理后的单句以及单句中词与词的依存关系;
对交通事故报告进行单句信息提取,每次只对交通事故报告中的一个句子进行内容抽取,遍历完交通事故报告中的所有句子后,抽取结束;
创建对象列表并置为空,所述对象列表中存放的是从句子中识别出的类或实例的实例化对象,若识别为实例,则先通过本体查找到其所属的父类类型,然后在查询对象列表,判断对象列表中是否存在该类的实例,若存在,则进行下一步,若不存在,则先生成该类的实例化对象,将对象添加到列表中后再进行下一步;
遍历实体的依存关系,包括对依存关系的查找,以及实例对象的属性填充。
5.根据权利要求1所述交通事故报告提取与场景类型推理方法,其特征在于,在所述推理得到本体中隐含的其他关联结构的步骤中,用SWRL语言描述场景推理规则,并使用软件对规则进行编辑,通过推理引擎自动化推理得到本体中隐含的其他关联结构。
6.根据权利要求5所述交通事故报告提取与场景类型推理方法,其特征在于,所述通过推理引擎自动化推理得到本体中隐含的其他关联结构的步骤包括:导入OWL本体文件;
导入场景信息:将非结构化事故报告所转化为的结构化场景信息,在推理场景类型之前导入场景信息列表;
构建实例:将场景信息列表中的场景内容创建为对应类的实例的工作;
添加实例间的关联结构:将所有实例间的关联关系也填充到本体中;
用推理引擎:推理引擎根据实例化的本体信息,在规则库中进行查找,并返回满足条件的推理结果;
输出推理结果:输出结构化场景信息所对应的场景类型。
7.一种交通事故报告提取与场景类型推理系统,其特征在于,包括:事故本体构建模块,用于对交通事故场景的实体进行分类,对V2V事故领域本体进行构建;
数据预处理模块,用于对交通事故报告进行数据预处理;
事故信息提取模块,用于对数据预处理后的交通事故报告进行事故信息提取,获取事故场景的具体信息;
场景类型输出模块,用于推理得到本体中隐含的其他关联结构,输出结构化场景信息所对应的场景类型;
在所述对交通事故场景的实体进行分类,对V2V事故领域本体进行构建的步骤中,设计出V2V事故领域本体的类属结构、对象属性和若干实例,通过OWL语言和本体构建工具对基本体进行构建;V2V事故领域的核心本体包括以下模块:Vehicle、Obstacle、ObjectBehavior、Environment、Road NetWork和Accident Scenario Type;其中,Vehicle描述主要的交通参与者;Obstacle通过其状态分为两种对象:静态障碍物和动态障碍物;所述的Obstacle和Vehicle通过抽取出共同的行为属性,衍生出Object Behavior,用于描述实体的行为动作;Environment作为事故场景中的环境要素,描述天气状态和光照条件;RoadNetWork作为描述道路路网的模块,包含路网形状及其物理结构;Accident Scenario Type是事故场景类别模块,标识事故场景的类型;
所述对数据预处理后的交通事故报告进行事故信息提取的具体步骤包括:定义一个特定领域词典,然后通过正则匹配,将报告中满足匹配条件的特定词汇“A”和“B”,转换成“A-B”的形式,使之成为一个整体;
将文本中的指代词还原为其原本所指代的对象;
进行句子边界检测,将文本转换为若干的单句;
利用自然语言处理工具包对非结构化的事故报告进行依存分析,获得句子中词与词之间的依存关系。
8.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述交通事故报告提取与场景类型推理方法中的步骤。