欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2023118285705
申请人: 慈兴权
专利类型:发明专利
专利状态:授权未缴费
专利领域: 计算;推算;计数
更新日期:2024-08-21
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.准确理解语义的电商平台智能客服问答系统,其特征在于,问题的分析采用对问题的语义的理解,信息检索利用问题分析的结果从知识谱中查找到相关知识,答案的生成根据检索出的知识生成对用户的回答;采用实类结构去提取知识,构建基于电商平台实类的自动问答系统,由电商实类知识谱的构建、电商平台问句语义理解和答案的提取三个部分组成;

(1)电商实类知识谱的构建:包括实类知识谱的存储和结构、实类的挖掘两个方面:1)在实类的存储时,建立利用关系数据库以纵向模式存储实类的方法,将实类中的概念、个体以实体的方式存储,而将实类中两个元素之间的包括属性、包含的各种关联以关系的形式,通过记录存储在关系表中,即实类的纵向存储模式;2)通过构建电商平台数据库结构,挖掘用户询问的知识就在数据库的各个数据表中,数据表的格式固定,通过对数据表每条数据的每个字段的解析,提取实类信息,并建立实类的自动维护和更新机制;

(2)电商平台问句语义理解:问句处理中首先进行分词,然后根据分词结果对问句进行句法解析,分词采用融合实类知识谱的词法分析分词方法,将实类知识谱中的概念、个体名词性语义添加进词法分析中提高分词的准确性,另外归纳电商平台常用问句模型,并构建疑问词在不同位置的句法解析方法,解析析出问句的主谓宾成分,进而得到问句的语义分类;

(3)答案的提取:构建基于问句模型的近似度计算方法:通过分词结果,提取问句的句型结构,在进行问句分类之后,与分类中的问句模型从长度、成分、顺序方面计算近似度,对于不同的问句模型,分别构建从实类库中提取检索结果的sql语句,从而得到答案;

(4)构建基于电商平台实类的问答系统:构建系统总体框架,基于C#语言运行在.netframework之上,建立实类知识知识谱,问答处理系统回答用户在具体的电商平台的提问。

2.根据权利要求1所述准确理解语义的电商平台智能客服问答系统,其特征在于,电商实类知识谱的构建及实类的提取:采用关系数据库来存储实类,采用三元组作为知识的基本单位,通过纵向模式来存储OWL资源;

问答系统中的知识来源于问答系统所依附的电商平台数据库,电商平台实类知识谱的构建通过分析具体的电商平台数据库,从中构建出实类,并将实类数据存放在数据库中。

3.根据权利要求1所述准确理解语义的电商平台智能客服问答系统,其特征在于,电商平台数据解析:(1)根据分类层次,将商品的分类定义成类Class,其中,父分类ID为0的默认为顶层类,而其它的类根据继承关系采用rdfs:subClassOf来声明概念的继承关系;

(2)类型的属性对应关系Propertyof关系;(3)商品的属性值是属性,是实例的属性;

(4)具体的商品记录是实例,实例和概念之间的关系是InstanceOf;

(5)商品的分类与分类之间存在继承与派生的关系。

4.根据权利要求1所述准确理解语义的电商平台智能客服问答系统,其特征在于,电商平台实类的存储:采用四个数据表来存储电商平台实类,其结构和模型分别如下:(1)实体表:电商平台所有出现的名词术语都看作是可识别的实体,实体的类型包括概念、实例、属性、属性的约束,其中属性包含数据属性和对象属性,与protege中的属性一致;

模型1:实体entity<实体ID,实体名称,实体类别ID,实体描述>

其中实体类别ID是外键,引用自实体类别表;

(2)实体类别:描述类型的名称,用以确定实体的类别及实体的范围的约束;

模型2:实体类别type<类别ID,类别名称,类别约束>

(3)关系类型:描述实体之间的关系的种实类,关系类型包含实类描述中最基本的四种关系,根据需要增加用于推理或描述更强的逻辑的推理关系,关系类型可扩展;

模型3:关系类型<关系类型ID,关系类型名称,关系类型描述>

(4)实体关系:描述实体表中的实体之间的关系,实体之间的关系是实类的知识性体现,实类中描述事实的知识,通过各种实类实体的关系来体现,关系类型越多,实类知识越丰富;

模型4:实体关系

5.根据权利要求1所述准确理解语义的电商平台智能客服问答系统,其特征在于,基于电商实类知识谱的分词系统:添加用户自定义词典,将用户的词典添加进词法分析,并优先识别,流程概括如下:步骤一:扫描实类知识谱的实体数据表,获取其中的专有名词,组成词典,其中实体表中全部是名词,词典中的词的词性为名词;

步骤二:将步骤一的词典添加进词法分析;

步骤三:采用新的词法分析进行分词并进行词性标记,得到符合电商平台需要的分词和词性标记。

6.根据权利要求1所述准确理解语义的电商平台智能客服问答系统,其特征在于,问句句法解析:取得问句中的主谓宾的结构及其之间的关系,在疑问代词作主语、宾语和定语的情况,其中,疑问代词作主语时有谓语动词紧随其后,疑问代词和谓语动词的距离是1,疑问代词作宾语处于问句末尾,疑问代词作定语需要根据疑问代词和谓语动词的位置信息做出对应判断,以上过程详细描述如下:第一步:将词法分析中的分词及标记结果存入数组;

第二步:查找疑问代词,一个问句中只有一个疑问代词;

第三步:查找谓语动词:在问句中,谓语动词离疑问代词最近;

第四步:分析主语和宾语部分:

(1)疑问代词在句末,此时疑问代词做宾语,谓语动词之前的名词作为特征主语;

(2)疑问代词不在句末,且谓语动词紧跟疑问代词之后,此时疑问代词做主语,谓语动词之后的名词作为特征宾语;

(3)疑问代词不在句末,且和谓语动词不相邻,此时疑问一般作定语,又分为两种情况:

1)疑问代词在谓语动词之前:疑问代词和谓语动词之间的名词作为特征主语项,如果疑问代词和谓语动词之间没有名词,则谓语动词之后的名词作为特征宾语项;

2)疑问代词在谓语动词之后:疑问代词之后的名词作为特征宾语项,如果疑问代词之后没有名词,将谓语动词之前的名词作为特征主语项。

7.根据权利要求1所述准确理解语义的电商平台智能客服问答系统,其特征在于,基于问题分类的问句模型的建立:结合对实类数据库的构造,归纳出常见的问句模型,采用问句模型解析和匹配的方法来理解问句;本申请从电商平台用户的检索目的、用户的询问方式,并结合关系数据库纵向存储的实类知识谱中进行检索的方法来构建问句模型。

8.根据权利要求1所述准确理解语义的电商平台智能客服问答系统,其特征在于,问句模型识别:设待识别的问句为S,系统问句模型集合为M={M1…Mn},该过程就是从M中找出与S最适合的文具模型Ms,采用的问句模型识别过程包括2个步骤:对S去除语义块部分,得到问句S的逻辑结构Si;计算Mi与Si之间的近似度,最后选择最大近似度所对应的问句模型作为S的句型结构,若最大近似度小于一个设定的临界值,则匹配失败,语句S不是问句或语义理解失败;

1)问句句型结构解析对于疑问代词语义块:结合词法分析的分词结果和预定的疑问代词库进行查找,提取出问句中的疑问代词语义块;

对于特征词:特征词即是需要检索的目标,是用户询问的语义,特证词在疑问代词或谓语附近,即主语、宾语或定语;

对于问句的检索主体:是名词或名词性的短语,本申请直接采用分词的结果以变量的形式表示,在检索时,通过实类知识谱去识别问句中的变量成分,并根据问句模型构建检索;

通过以上过程,问句被表示成问句模型,其中除掉特征词的部分用参数表示,问句最终转换成对实类的检索,需要根据已有的模型去匹配,在此之前,需要在问句模型库中找到最合适的模型,从问句模型库中查找与用户问句模型最合适的模型,通过计算用户问句的句型和问句模型库中的模型的近似度;

2)问句模型近似度计算得到句型结构Si后,识别该结构是否与对应的句型模式Mi相匹配,采用语句近似度来计算二者之间的近似度,实现句型结构Si与问句模型Mi的匹配识别;

问句S以句型模式Mi为模板生成句型结构Si,(Mi,Si)都是由短语和表示词性的标记所组成的符号集合,其中模型中包含动态语义块和特征语义块,问句模型Mi与问句S的近似度由Mi与句型结构Si的近似度表示,包括3个部分:

1))模型长度近似度:长度指语义块的数量,设句型结构Si的长度为m,问句模型Mi的长度为n,则用户问句S和句型模型M之间的近似度SimLen用式1计算:

2))句型成分近似度:引入向量的点积进行计算,设句型结构Si的语义块的个数为m(即长度为m),问句模型Mi的语义块的个数为n(即长度为n) ,Si中每个成分(语义块)的权值向量分别为:Ws=(ws1 ,ws2 ,… ,wsm},Mi中每个成分(语义块)的权值向量分别为:Wm={wm1 ,wm2,…,wmn} ,其中wm1+wm2+…+wmn=1,每个值在构造问句模型时,根据问句各成分的重要性,由人工确定;

对Ws中的每个值,则是Si中的每个语义块和Mi中的每个语义成分的近似程度,如果Si中的每个成分在Mi中存在,则对应的wsi=1,否则则认为不存在,当m不等于n时,取其中较短的向量,句型的成分近似度SimTerm利用式2计算:SimTerm=Ws*Wm 式2

式2就是Ws和Wm两个向量的点积;3))序列近似度:与句型模式Mi各语义块相比较,记录句型结构Si中各语义块成分在Mi中的位置与在Si中的位置不相同的个数,记为逆序的个数为num;

序列近似度SimOrder利用式3计算:

综上计算出总的句型近似度Sim,总的句型近似度由模型长度近似度、句型成分近似度、序列近似度线性组合而成:Sim=k1*SimLen+k2*SimTerm+k3*SimOrder 式4在式4中:k1,k2,k3分别是模型长度近似度SimLen、句型成分近似度SimTerm、序列近似度SimOrder的权值,表示各近似度在总近似度中的比重成分,且k1,k2,k3满足k1+k2+k3=1,那么Sim∈[0,1],Sim值越高,说明问句S和某个问句模型Mi越匹配;

设置k1=0.7,k2=0.2,k3=0.1,增加问句模型的适应程度,尽可能将语义成分引入实类知识谱中去检索推理;

以上过程的简要描述如下:步骤1:根据句法解析的结果,选择问句的句型分类;

步骤2:提取问句的结构:遍历分词结构,提取问句中的名词和形容词部分作为参数,参数化的问句即为问句的结构Si;

步骤3:计算问句结构和问句所属分类中的各问句模型的近似度,选取最优的问句模型。

9.根据权利要求1所述准确理解语义的电商平台智能客服问答系统,其特征在于,构造检索语句与生成答案:

1.在实类知识谱中检索的步骤第1步:扫描问句,提取问句模型中的变量,根据最匹配的模型,利用分词结构,将模型中的变量赋值;

第2步:在本地知识谱中查找变量所对应的实类类型,在内存中构建实类模型,并检索;

1)首先查找实体表,搜索出各变量对应的实体类型,在实体表中查找,找到之后,并查找其实体类型;

2)对在实体表中查找不到的,则在关系表中查找关系取值字段,并根据第1步中找到的实体类型进行配合查找,找到对应的实体,此实体是检索主体;

3)分析检索特证词,对第2步中找到的主体进行检索,检索主体的相关特征,得到需要返回的答案;

4)如果第1步和第2步其中一个检索失败,则实类知识谱中的知识不能回答用户的问题,返回失败;

2.在内存中构建检索主体及其关系模型在检索过程中,当扫描完实体,如果只有一个概念或个体的时候,确定这个概念或个体就是检索的主体,此时再次检索数据库,通过检索实体的关系表,挖掘检索主体的各种关系;

如果在检索语句中出现两个及以上的概念或个体,此时问句的语义是求取两个概念或个体之间的关系,以两个概念或个体,在关系实体中检索并返回其中的关系或关系值。

10.根据权利要求1所述准确理解语义的电商平台智能客服问答系统,其特征在于,建立实类知识知识谱:自动建立并提取实类的方法:(1)实类知识存储数据库的关系模型

实类知识谱将每一个数据拆分成最基本的元素,分析这些基本元素之间的关系,进而形成语义知识;

(2)自动提取实类的步骤

1)设定实类知识数据库中的实体类别和关系类别:实体类别是实类中出现元素的集合,实类中出现的元素包括:概念、个体、对象属性、数据属性,数据属性描述个体属性,具有具体的值;

关系类别描述各元素之间的关系,包括:0bjectProperty0f:描述概念和其对象属性的关系;DataPropertyOf:描述个体和其数据属性的关系,此时除二者之间的关系外,还包含二者的关系取值;InstanceOf:描述概念和个体之间的关系,某个具体的商品是某个商品分类的实例;SubClassOf:描述概念和概念之间的从属关系,描述商品分类之间的从属关系;PartOf:描述概念与概念之间的整体和部分的关系;

2)扫描商品分类表,建立商品分类的顶级概念,并将顶级概念存储到实类知识谱中的实体表中,类别为概念,对于父分类为0的分类表示顶级概念,如果父分类不为0,则为子分类,需要建立子分类和父分类之间的关系,关系类型为SubClassOf;

3)扫描商品属性名表,将商品分类的属性存储到实类知识数据库的实体表中,类别为对象属性;同时将商品属性和商品分类的关系存储到实类知识数据库的实体关系数据表中,关系类型为DataPropertyOf,关系值为空;

4)扫描商品表,逐条记录建立商品的个体,并将商品的个体存储到实体表中,实体类型为个体;同时将商品的个体和其所属分类建立关系,关系类型为InstanceOf,关系值为空;

5) 扫描商品属性值表,将商品个体和其属性建立关系,此时的关系类型是DataPropertyOf的关系,并且将关系值存储;

6)对于商品的SKU,将其设置成个体和属性的关系;

通过以上步骤,将电商平台平台的商品数据表以实类知识的组织形式存储进关系数据库,以上关系描述实类的知识。