欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 202210884132X
申请人: 深圳市迪斯声学有限公司
专利类型:发明专利
专利状态:授权未缴费
专利领域: 乐器;声学
更新日期:2023-08-29
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种语音识别方法,其特征在于,所述方法包括:

S1、获取待分析语音,通过回波混响方式对所述待分析语音进行语音纠正,得到目标语音,其中,所述通过回波混响方式对所述待分析语音进行语音纠正,得到目标语音,包括:S11、对所述待分析语音的进行降噪处理,得到一级语音;

S12、利用如下信号算法提取所述一级语音的回波信号值:

其中, 是所述一级语音的输入信号, 是所述一级语音的输出信号, 是所述输入信号与所述输出信号之间的转化参数, 是所述一级语音的期望信号,所述是所述一级语音的回波信号, 是一级语音的目标函数;

S13、根据所述回波信号值对所述一级语音进行混响消除操作,得到目标语音;

S2、通过信号分区方式将所述目标语音转换为语音向量,包括:按照固定的振幅频率对所述目标语音进行取值,得到分区语音;

利用预设的模数转化器将所述分区语音进行数字信号转化,得到多个分区信号;

从多个所述分区信号中逐个选取其中一个分区信号为目标分区信号,在预设的空白坐标系上对所述目标分区信号进行标记,得到所述目标分区信号的信号坐标;

利用如下形心算法计算所述信号坐标的形心坐标:

其中,是所述信号坐标的形心坐标,是所述信号坐标总个数,是第 个所述信号坐标, 是所述目标分区信号的信号强度, 是 个所述目标分区信号的总信号强度,是第个所述信号坐标到所述形心坐标的力矩;

根据所述形心坐标和所述信号坐标得到所述目标分区信号的语音向量;

S3、通过均值算法和偏差度算法对所述语音向量进行初始化设置,得到初始参数,包括:利用如下均值算法计算所述语音向量的平均值,得到参考向量:其中, 是参考向量,是所述语音向量的总个数,是第 个所述语音向量的标识, 是第 个所述语音向量在预设二维坐标系内投影得到的坐标;

利用如下偏差度公式逐个计算每个所述语音向量与所述参考向量的分偏差度:其中,是所述语音向量与所述参考向量的分偏差度, 是对 个所述语音向量的坐标进行加和后得到的总向量坐标;

将多个所述分偏差度进行加和,得到总偏差度,汇集所述参考向量和所述总偏差度为初始参数;

S4、根据迭代思想对所述初始参数进行分裂,根据分裂后的初始参数获取所述语音向量的语音特征,将所述语音特征输入至预设的语音解码模型,得到所述待分析语音的语音语义;包括:S41、对所述参考向量进行分裂处理,得到第一分裂向量和第二分裂向量;S42、按照所述第一分裂向量和所述第二分裂向量对所述语音向量进行区域划分,得到第一编码分区和第二编码分区;S43、逐个计算所述第一编码分区内的语音向量与所述第一分裂向量的第一分偏差度;S44、逐个计算所述第二编码分区内的语音向量与所述第二分裂向量的第二分偏差度;S45、将所述第一分偏差度和所述第二分偏差度进行加和,得到分裂偏差度,比较所述分裂偏差度与预设阈值的大小;当所述分裂偏差度大于等于预设阈值,执行S46、将所述第一分裂向量作为新的参考向量返回步骤S41,并将所述第二分裂向量作为新的参考向量返回步骤S41,直至当所述分裂偏差度小于预设阈值;当所述分裂偏差度小于预设阈值,执行S47、完成所述初始参数的分裂。

2.如权利要求1所述的语音识别方法,其特征在于,所述对所述待分析语音的进行降噪处理,得到一级语音,包括:获取所述待分析语音的频谱,选取所述频谱中的预设区间的频谱作为目标频谱;

利用如下噪声算法计算所述目标频谱的信噪比:

其中,是所述目标频谱的信噪比,是所述目标频谱总功率, 是噪声功率, 是所述目标频谱中含信号有效带宽处的功率,是所述目标频谱中不含信号有效带宽处的功率;是所述目标频谱中有色干扰处的功率;

利用所述信噪比对所述频谱进行降噪处理,得到一级语音。

3.如权利要求1所述的语音识别方法,其特征在于,所述根据分裂后的初始参数获取所述语音向量的语音特征,包括:根据分裂后的初始参数获取所述语音向量的编码分区,以及根据分裂后的初始参数获取所述参考向量的参考分量;

生成所述参考分量的分量标签,将所述分量标签作为所述编码分区的索引,并将所述编码分区和所述参考分量进行关联存储,得到所述语音向量的语音特征。

4.如权利要求3所述的语音识别方法,其特征在于,所述将所述语音特征输入至预设的语音解码模型,得到所述待分析语音的语音语义,包括:利用预设的音素集合对所述语音特征进行音素标记,得到所述语音特征的候选词序列集;

对所述候选词序列集中的候选词进行文本情境分析,得到所述候选词的词频;

选取所述词频最大的候选词为目标词,对所述目标词进行组合,得到所述待分析语音的语音语义。

5.一种可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至4中任意一项所述的语音识别方法。