1.一种面向阅读理解问答的多角度答案验证方法,其特征在于,其步骤为:步骤一、获取阅读理解问答的基础数据,运行开源阅读理解问答方法,针对基础数据中每个问题Q,得到其对应的答案A,答案对应的概率y0,即答案与问题相匹配的概率,也即答案的合法性,答案所在的句子C,答案正确与否的标志 答案正确则 答案错误则将每个 作为一条训练数据;
步骤二、对步骤一所得Q、A、C进行分词、词性标记、命名实体识别,对答案所在的句子进行依存句法分析,得到答案所在句的依存句法树;
步骤三、将步骤二所得每个词语替换为词向量,将词语的词性、实体类型转换为one‑hot编码,将三者串联起来,获得 其中, 分别表示Q、A、C中第t个词的词向量,q、a、c分别表示词语的个数;
步骤四、针对每组训练数据,将 输入混合模型,得到Q、A、C融合上下文信息的词向量表示
步骤五、混合模型将 送入答案合法性判定模型,得到问答合法的概率y1;混合模型将 送入答案可信度计算模型,得到问答对可信的概率y2;
步骤六、混合模型将通过合法性判定模型得到的y1、通过可信度计算模型得到的y2、阅读理解问答得到的y0一起送入一个二分类的多层感知机,得到该答案为正确答案的概率:y=MLP3(y0,y1,y2)步骤七、比较y与 对步骤四~步骤六中的参数进行训练;
步骤八、不断重复步骤四~步骤七,循环一个固定的次数停止,得到训练好的答案验证混合模型;
步骤九、针对任意一个阅读理解问答方法,在任何阅读理解问答场景下,得到的<Q,A,C,y0>,送入训练好的答案验证模型,对答案正确与否做出判断。
2.根据权利要求1所述的一种面向阅读理解问答的多角度答案验证方法,其特征在于:步骤二利用stanford的词法句法分析工具,对所有的Q、A、C进行分词、词性标记、命名实体识别;步骤三下载GLOVE词向量表,将步骤二所得每个词语替换为GLOVE词向量。
3.根据权利要求1或2所述的一种面向阅读理解问答的多角度答案验证方法,其特征在于:步骤四中利用双向循环神经网络BiRNN1,分别对 进行编码,得到Q、A、C融合上下文信息的词向量表示 BiRNN1中循环神经网络将采用LSTM,前向和后向循环神经网络的输出通过串联方式连接。
4.根据权利要求3所述的一种面向阅读理解问答的多角度答案验证方法,其特征在于:步骤五中答案合法性判定模型利用一个预先定义的参数向量α对问题 进行关注,得Q
到问题Q的新向量表示u ,如(2)式所示,其中st为α对 的关注值,按(3)式计算,S为一个参数矩阵:
答案合法性判定模型利用答案 对问题 的关注,获得给定问题情况下答案的新的向量表示 如(4)式所示;其中,rtj为答案中第t个词 对问题中第j个词的关注值,按(5)式计算,R为参数矩阵:
5.根据权利要求4所述的一种面向阅读理解问答的多角度答案验证方法,其特征在于:步骤五中答案合法性判定模型首先将 送入双向循环神经网络BiRNN2中,得到的第一个和最后一个状态的串联组合 被作为答案新的表示;
Q
答案合法性判定模型将 和u一起送入二分类多层感知机MLP得到该问答合法的概率y1,如式(7)所示:
6.根据权利要求5所述的一种面向阅读理解问答的多角度答案验证方法,其特征在于:步骤五中答案可信度计算模型将问题 和答案 顺序串联输入到双向循环神经网络BiRNN3中,得到问答对的语义表示 如式(8)所示; 为问答对的第t个词的语义表示,qa表示问答对中词语的总数,qa=q+a;
利用Dependency Tree‑LSTM,根据C的句法分析结果,将 转换为树型网络的形式 其中 为树型网络中第t个节点的语义表示,n为句法树中节点的个数;
答案可信度计算模型将分别采用串到串、串到树两种方式计算 对 和的关注值,得到问答对的新的语义表示 如式(10)所示,其中wtj和vtj分别为串到串、串到树的关注值,计算方式如(11)、(12)所示,其中W、V为参数矩阵;
7.根据权利要求6所述的一种面向阅读理解问答的多角度答案验证方法,其特征在于:步骤五中答案可信度计算模型将 送入双向循环神经网络BiRNN4,得到如(13)式所示, 为初始化参数; 的第一个和最后一个状态串联组合 作为问答对的最终表示;
答案可信度计算模型将 送入一个二分类的多层感知机,如式(14)所示,得到该问答对可信的概率y2:
8.根据权利要求7所述的一种面向阅读理解问答的多角度答案验证方法,其特征在于:步骤七中使用AdaGrad算法对参数进行训练,AdaGrad的学习率被设置为0.01,对步骤四~步骤六中的BiRNN1~BiRNN4,MLP1~MLP3,TreeLSTM中的参数以及α、S、R、W、V进行调整。