1.一种法律案件争议焦点获取方法,其特征在于,包括以下步骤:S1、获取具有争议焦点的法律文本;
S2、采用规则匹配方法得出争议焦点的类别并将其作为标签,制作法律案件争议焦点数据集;
S21、采用规则匹配方法寻找出历史争议焦点数据的焦点类型的概率值或者距离值;
S22、按照焦点类型的概率值或者距离值所对应的均方根误差,求取出对应的回归值;
S23、求取出均方根误差值所对应的损失值最小时的分配系数,在该分配系数下,通过改变初始回归值,从而确定出最小损失函数下的回归预测值;
S24、利用分配系数与相应的回归预测值乘积作为焦点数据的第一标签,形成增强后的法律案件争议焦点数据集;
S3、将原被告陈述内容作为输入,采用孪生BERT模型,对所述法律案件争议焦点数据集进行训练,得到训练模型结果;
S4、在训练好的模型中输入未知争议焦点的法律文本,输出焦点类型的标签,并得到最终争议焦点结果。
2.根据权利要求1所述的一种法律案件争议焦点获取方法,其特征在于,采用规则匹配方法寻找出历史争议焦点数据的焦点类型的概率值包括对提取出的争议焦点去掉冗余词与共有词,并进行同义词转换;统计出各焦点类型包含的关键词;生成焦点类型关键词字典;获取焦点描述词,将焦点描述词与所述焦点类型关键性词典进行比较,得到各焦点描述词属于焦点类型关键词词典中焦点类型的概率值。
3.根据权利要求1所述的一种法律案件争议焦点获取方法,其特征在于,采用规则匹配方法寻找出历史争议焦点数据的焦点类型的距离值包括对提取出的争议焦点去除冗余词与共有词;并进行同义词转换;根据争议焦点的类型列表,统计出已处理的争议焦点中各类型的争议焦点,生成焦点关键词;将焦点关键词中的各争议焦点转换为争议词向量,以争议焦点词向量的均值作为争议焦点句向量,得到焦点类型句向量,获取法律样本中的焦点句,通过相似度计算得到焦点类型的距离值。
4.根据权利要求1所述的一种法律案件争议焦点获取方法,其特征在于,所述采用规则匹配方法得出争议焦点的类别并将其作为标签,制作法律案件争议焦点数据集还包括为历史争议焦点的法律文本设置出原被告优先级、时间优先级以及区域优先级,选择出综合优先级最高的争议焦点作为第一数据集,将相应时间段的争议焦点的概率值均值或者距离值均值分别作为第一数据集对应的初始回归值,通过最小化损失函数,确定出该时间段所对应的分配系数,在该分配系数下,通过改变初始回归值,从而确定出最小化损失函数所对应的回归值,将每时间段的分配系数与相应时间段的最小化损失函数下的回归值之间的乘积作为该历史争议焦点的焦点类型,并确定出该焦点类型的第一标签。
5.根据权利要求4所述的一种法律案件争议焦点获取方法,其特征在于,所述焦点类型的争议焦点结果表示为{R1,R2,......Rn},其中n为整理所得所有的争议焦点个数,将其作为标签{label1,label2,......,labeln},并将原被告陈述内容进行整理和提取,得到原告陈述内容Yi,1≤i≤m,其中m为法律文本总篇数;被告陈述内容Bi,1≤i≤m;每个案件的原被告内容相对应,且都对应n个标签;得到法律案件争议焦点数据集。
6.根据权利要求1所述的一种法律案件争议焦点获取方法,其特征在于,所述步骤S3包括将原告陈述和被告陈述分别输入BERT模型,将原告陈述内容Yi,1≤i≤m输入第一BERT模型后得到其句嵌入ui,1≤i≤m,将被告内容Bi,1≤i≤m输入与原告陈述内容共享参数的第二BERT模型后得到其句嵌入vi,1≤i≤m;将这两个句嵌入进行交互得到最终的句嵌入结果si,si=ui+vi,1≤i≤m;将句嵌入结果si,si=ui+vi,1≤i≤m放入softmax中,得到争议焦点分类结果,损失函数为交叉熵函数,最终得到每个标签训练后的模型结果{model1,model2,......,modeln};其中,+表示为句向量相加。
7.一种法律案件争议焦点获取装置,其特征在于,所述装置包括:采集模块,用于采集具有争议焦点的法律文本;
规则类别模块,用于获取争议焦点的类型,并对该类型打上标签;
孪生BERT模型模块,对采集模块采集的具有争议焦点的法律文本和规则类型模块输入的争议焦点进行训练;
焦点输出模块,用于输出未知争议焦点的法律文本的焦点类型结果。
8.根据权利要求7所述的一种法律案件争议焦点获取装置,其特征在于,所述装置还包括推荐模块,用于对焦点输出模块输出的焦点类型结果进行推荐。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1~6中任一项所述方法的步骤。