欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2018113890870
申请人: 百度在线网络技术(北京)有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 乐器;声学
更新日期:2024-02-23
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种语音数据的标注方法,其特征在于,所述方法包括:根据用户行为日志从线上拉取用户输入的语音数据;

利用N个第一语音识别模型对所述语音数据进行识别,得到对应同一个语音数据的N个文本识别结果,其中N为大于等于2的正整数;

判断同一个语音数据对应的N个文本识别结果彼此是否一致,若一致,则将N个文本识别结果中的任意一个作为该语音数据的标注结果。

2.根据权利要求1所述的方法,其特征在于,所述根据用户行为日志从线上拉取用户输入的语音数据包括:根据用户行为日志从线上拉取用户未修改文本识别结果的语音数据。

3.根据权利要求1所述的方法,其特征在于,在所述利用N个第一语音识别模型对所述语音数据进行识别之前,还包括:根据用户行为日志从拉取的语音数据中确定用户未修改文本识别结果的语音数据。

4.根据权利要求1所述的方法,其特征在于,所述判断同一个语音数据对应的N个文本识别结果彼此是否一致包括:计算所述同一个语音数据的N个文本识别结果彼此之间的文本相似度;

当各文本识别结果彼此之间的文本相似度均大于预设阈值时,则确定该语音数据的多个文本识别结果彼此一致,否则不一致。

5.根据权利要求1所述的方法,其特征在于,若判断同一个语音数据对应的N个文本识别结果彼此不一致,所述方法还包括:将文本识别结果彼此不一致的语音数据发送至标注平台进行人工标注;

获取标注平台返回的人工标注结果,将人工标注结果作为该语音数据的标注结果。

6.根据权利要求2或3所述的方法,其特征在于,所述方法还包括:获取用户在线上修改文本识别结果的语音数据;

将所述用户修改文本识别结果的语音数据发送至标注平台进行人工标注;

获取标注平台返回的人工标注结果,将人工标注结果作为该语音数据的标注结果。

7.根据权利要求1所述的方法,其特征在于,在所述将N个文本识别结果中的任意一个作为该语音数据的标注结果之后,还包括:对所述语音数据的标注结果进行抽样质检;

将质检结果达到预设要求的语音数据的标注结果确定为合格,否则确定为不合格;

保留确定为合格的语音数据的标注结果。

8.根据权利要求7所述的方法,其特征在于,若语音数据的标注结果确定为不合格,所述方法还包括:使用M个第二语音识别模型对标注结果不合格的语音数据进行识别,得到对应同一个语音数据的M个文本识别结果,其中M为大于等于2的正整数;

若同一个语音数据的M个文本识别结果一致,则将M个文本识别结果中的任意一个作为该语音数据的标注结果,若不一致,则将该语音数据丢弃。

9.一种语音数据的标注装置,其特征在于,所述装置包括:拉取单元,用于根据用户行为日志从线上拉取用户输入的语音数据;

识别单元,用于利用N个第一语音识别模型对所述语音数据进行识别,得到对应同一个语音数据的N个文本识别结果,其中N为大于等于2的正整数;

标注单元,用于判断同一个语音数据对应的N个文本识别结果彼此是否一致,若一致,则将N个文本识别结果中的任意一个作为该语音数据的标注结果。

10.根据权利要求9所述的装置,其特征在于,所述拉取单元在根据用户行为日志从线上拉取用户输入的语音数据时,具体执行:根据用户行为日志,从线上拉取用户未修改文本识别结果的语音数据。

11.根据权利要求9所述的装置,其特征在于,在所述识别单元利用N个第一语音识别模型对所述语音数据进行识别之前,具体执行:根据用户行为日志,从拉取的语音数据中确定用户未修改文本识别结果的语音数据。

12.根据权利要求9所述的装置,其特征在于,所述标注单元在判断同一个语音数据对应的N个文本识别结果彼此是否一致时,具体执行:计算所述同一个语音数据的N个文本识别结果彼此之间的文本相似度;

当各文本识别结果彼此之间的文本相似度均大于预设阈值时,则确定该语音数据的多个文本识别结果彼此一致,否则不一致。

13.根据权利要求9所述的装置,其特征在于,若所述标注单元判断同一个语音数据对应的N个文本识别结果彼此不一致,还具体执行:将文本识别结果彼此不一致的语音数据发送至标注平台进行人工标注;

获取标注平台返回的人工标注结果,将人工标注结果作为该语音数据的标注结果。

14.根据权利要求10或11所述的装置,其特征在于,所述标注单元还具体执行:获取用户在线上修改文本识别结果的语音数据;

将所述用户修改文本识别结果的语音数据发送至标注平台进行人工标注;

获取标注平台返回的人工标注结果,将人工标注结果作为该语音数据的标注结果。

15.根据权利要求9所述的装置,其特征在于,在所述标注单元将N个文本识别结果中的任意一个作为该语音数据的标注结果之后,还具体执行:对所述语音数据的标注结果进行抽样质检;

将质检结果达到预设要求的语音数据的标注结果确定为合格,否则确定为不合格;

保留确定为合格的语音数据的标注结果。

16.根据权利要求15所述的装置,其特征在于,若语音数据的标注结果确定为不合格,所述标注单元还具体执行:使用M个第二语音识别模型对标注结果不合格的语音数据进行识别,得到对应同一个语音数据的M个文本识别结果,其中M为大于等于2的正整数;

若同一个语音数据的M个文本识别结果一致,则将M个文本识别结果中的任意一个作为该语音数据的标注结果,若不一致,则将该语音数据丢弃。

17.一种设备,其特征在于,所述设备包括:一个或多个处理器;

存储装置,用于存储一个或多个程序,

当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-9中任一所述的方法。

18.一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-9中任一所述的方法。