1.一种样本生成方法,其特征在于,包括:
提取历史答案中的答案语句的关键词词组,根据所述历史答案的评分标准确定所述关键词词组的关键词评分权重;
获取答案样本参数,所述答案样本参数包括答案样本的评分范围;
根据所述关键词评分权重确定关键词词组组合方案的评分在所述答案样本的评分范围内的关键词词组组合方案;
根据所述组合方案生成答案模板,生成与所述答案模板语义相近的答案样本。
2.根据权利要求1所述的方法,其特征在于,所述提取历史答案中的答案语句的关键词词组,包括:对所述历史答案中的答案语句进行分词处理,得到分词和与分词对应的分词向量;
按照预设的分词向量标签分类方法确定所述分词向量所对应的分词的分类标签;其中,所述分类标签用于指示所述分词是否为关键词或关键词中的预设部分;
将所述分词的分类标签为预设标签的分词确定为所述关键词词组。
3.根据权利要求2所述的方法,其特征在于,所述按照预设的分词向量标签分类方法确定所述分词向量所对应的分词的分类标签,包括:将所述分词向量输入至已训练好的双向长短期记忆网络模型进行分类,输出所述分词向量所对应的分词的标签概率向量;
根据所述标签概率向量,对所述分词进行条件随机场解码,得到所述分词的分类标签。
4.根据权利要求1所述的方法,其特征在于,所述根据所述历史答案的评分标准确定所述关键词词组的关键词词组评分权重,包括:获取所述历史答案的评分标准;
根据所述评分标准确定所述历史答案的答案语句的语句评分权重,将所述语句评分权重确定为所述关键词词组的关键词评分权重。
5.根据权利要求1所述的方法,其特征在于,所述根据所述组合方案生成答案模板,包括:获取所述组合方案中关键词词组对应的答案语句;
基于所述答案语句生成所述答案模板。
6.根据权利要求1所述的方法,其特征在于,所述生成与所述答案模板语义相相近的答案样本,包括:对所述答案模板进行分词处理,得到分词向量;
根据所述分词向量,生成与所述答案模板中每个分词语义相近的相似词集合;
使用所述相似词集合中的词替换所述答案模板中对应的词,得到所述答案样本。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述方法还包括:确定所述关键词词组对应的答案语句的句子向量;
基于所述关键词词组的对应的句子向量,计算所述组合方案中关键词词组之间余弦距离;
在基于所述组合方案中关键词词组之间余弦距离,确定所述组合方案为有效组合方案的情况下,触发所述根据所述组合方案生成答案模板的步骤。
8.一种样本生成装置,其特征在于,包括用于执行如权利要求1-7任一权利要求所述的方法的单元。
9.一种装置,其特征在于,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如权利要求1-7任一项所述的方法。