1.一种训练语言模型的方法,包括:获取至少一个标准词和与所述至少一个标准词具有相同含义的口语词,作为样本词;
以及
利用所述样本词和包含所述样本词的语句来训练语言模型。
2.一种标签设置方法,包括:利用语言模型识别通话记录文件,得到目标文本;
确定所述目标文本中的至少一个目标词;
将所述至少一个目标词转换为至少一个标准词;以及响应于用户针对所述至少一个标准词中目标标准词的选择操作,根据所述目标标准词,为所述通话记录文件设置标签;
其中,所述语言模型是根据权利要求1所述的方法训练的。
3.根据权利要求2所述的方法,其中,所述确定所述目标文本中的至少一个目标词包括:
根据标准词和口语词集合,确定所述目标文本中包含的标准词和/或口语词,作为所述目标词,其中,所述标准词和口语词集合包括至少一个标准词和至少一个口语词。
4.根据权利要求3所述的方法,其中,所述根据标准词和口语词集合,确定所述目标文本中包含的标准词和/或口语词包括:分别利用所述标准词和口语词集合中的每个词语,对所述目标文本进行词语匹配,以确定目标文本中的标准词和/或口语词。
5.根据权利要求3所述的方法,其中,所述将所述至少一个目标词转换为至少一个标准词包括:
针对所述至少一个目标词中的每个目标词,在所述目标词为口语词的情况下,根据词语对应关系,将所述目标词转换为对应的标准词,其中,所述词语对应关系用于表示具有相同含义的标准词和口语词之间的对应关系。
6.根据权利要求2所述的方法,还包括:向所述用户展示所述至少一个标准词。
7.根据权利要求2所述的方法,还包括:创建音视频通话;以及
录制所述音视频通话,得到所述通话记录文件。
8.一种训练语言模型的装置,包括:获取模块,用于获取至少一个标准词和与所述至少一个标准词具有相同含义的口语词,作为样本词;以及
训练模块,用于利用所述样本词和包含所述样本词的语句来训练语言模型。
9.一种标签设置装置,包括:识别模块,用于利用语言模型识别通话记录文件,得到目标文本;
确定模块,用于确定所述目标文本中的至少一个目标词;
转换模块,用于将所述至少一个目标词转换为至少一个标准词;以及设置模块,用于响应于用户针对所述至少一个标准词中目标标准词的选择操作,根据所述目标标准词,为所述通话记录文件设置标签;
其中,所述语言模型是根据权利要求1所述的方法训练的。
10.根据权利要求9所述的装置,其中,所述确定模块包括:确定子模块,用于根据标准词和口语词集合,确定所述目标文本中包含的标准词和/或口语词,作为所述目标词,其中,所述标准词和口语词集合包括至少一个标准词和至少一个口语词。
11.根据权利要求10所述的装置,其中,所述确定子模块具体用于:分别利用所述标准词和口语词集合中的每个词语,对所述目标文本进行词语匹配,以确定目标文本中的标准词和/或口语词。
12.根据权利要求10所述的装置,其中,所述转换模块包括:转换子模块,用于针对所述至少一个目标词中的每个目标词,在所述目标词为口语词的情况下,根据词语对应关系,将所述目标词转换为对应的标准词,其中,所述词语对应关系用于表示具有相同含义的标准词和口语词之间的对应关系。
13.根据权利要求9所述的装置,还包括:展示模块,用于向所述用户展示所述至少一个标准词。
14.根据权利要求9所述的装置,还包括:创建模块,用于创建音视频通话;以及录制模块,用于录制所述音视频通话,得到所述通话记录文件。
15.一种电子设备,包括:至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1‑7中任一项所述的方法。
16.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1‑7中任一项所述的方法。
17.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1‑7中任一项所述的方法。