欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2021102097088
申请人: 西华大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-02-23
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于特征融合与集成学习的语音情感分类方法,其特征在于,包括以下步骤:S1、采集若干语音数据,并对语音数据进行预处理;

S2、对预处理后的数据进行特征提取,并构建特征集;

S3、采用多分类器构建集成学习分类模型,并对集成学习分类模型进行训练;

S4、采用训练后的集成学习分类模型对待识别语音数据对应特征集进行识别,获取分类结果,得到语音情感分类结果。

2.根据权利要求1所述的基于特征融合与集成学习的语音情感分类方法,其特征在于,所述步骤S1中对语音数据进行预处理具体包括预加重、消除趋势项、端点处理、分帧处理以及加窗处理。

3.根据权利要求1所述的基于特征融合与集成学习的语音情感分类方法,其特征在于,所述步骤S2具体为:

S2.1、对预处理后的数据进行特征提取,得到若干特征;

S2.2、将若干特征组成若干维的特征向量;

S2.3、基于已训练的LightGBM模型,获取特征向量中每个特征的重要性,并按重要性将特征进行降序排序;

S2.3、获取特征重要度平均值,并将重要性低于平均值的特征滤除;

S2.4、采用序列前向算法选择最优特征子集,完成特征集的构建。

4.根据权利要求3所述的基于特征融合与集成学习的语音情感分类方法,其特征在于,所述步骤S2.1中特征包括特征1至特征809;

所述特征1‑8具体为:短时能量及其一阶差分的均值、方差、最大值以及最小值;

特征9‑14具体为:声音强度及其一阶差分的均值、方差以及最大值;

特征15具体为:平均语速;

特征16‑23具体为:基音频率及其一阶差分的均值、方差、最大值以及最小值;

特征24‑53具体为:第一、第二、第三共振峰频率及其一阶差分的均值、方差、最大值、最小值以及中值;

特征54‑137具体为:1‑12阶梅尔倒谱系数MFCC的均值、方差、最大值、最小值、中值、极差以及和;

特征138‑221具体为:1‑12阶伽马倒谱系数GFCC的均值、方差、最大值、最小值、中值、极差以及和;

特征222‑305具体为:1‑12阶巴克倒谱系数BFCC的均值、方差、最大值、最小值、中值、极差以及和;

特征306‑389具体为:1‑12阶线性预测系数LPC的均值、方差、最大值、最小值、中值、极差以及和;

特征390‑473具体为:1‑12阶线性预测倒谱系数LPCC的均值、方差、最大值、最小值、中值、极差以及和;

特征474‑557具体为:1‑12阶标准化伽马啁啾倒谱系数NGCC的均值、方差、最大值、最小值、中值、极差以及和;

特征558‑641具体为:1‑12阶基于幅度的谱根倒谱系数MSRCC的均值、方差、最大值、最小值、中值、极差以及和;

特征642‑725具体为:1‑12阶基于相位的谱根倒谱系数PSRCC的均值、方差、最大值、最小值、中值、极差以及和;

特征726‑809具体为:1‑12阶线性频率倒谱系数LFCC的均值、方差、最大值、最小值、中值、极差以及和。

5.根据权利要求1所述的基于特征融合与集成学习的语音情感分类方法,其特征在于,所述步骤S3中集成学习分类模型中分类器包括支持向量机SVM、K邻近算法、XGBoost算法和LightGBM算法。

6.根据权利要求5所述的基于特征融合与集成学习的语音情感分类方法,其特征在于,所述步骤S4具体为:

S4.1、对集成学习分类模型中支持向量机SVM、K邻近算法、XGBoost算法和LightGBM算法的分类结果分配权重为[w1 w2 w3 w4]1×4;

S4.2、将支持向量机SVM、K邻近算法、XGBoost算法和LightGBM算法分别设定为1至4号分类器;

S4.3、将待识别语音数据对应特征集分别输入至1至4号分类器,得到每种分类器输出的每种预测类型概率为[Pi1 Pi2 Pi3 Pi4 Pi5 Pi6]1×4,其中,i=1,2,3,4,i表示分类器号,Pij表示i号分类器对第j个类别的预测概率,j=1,2,3,4,5,6;

S4.4、根据分配的权重以及预测类型的概率,获取第j个类别的输出概率yj为yj=w1×P1j+w2×P2j+w3×P3j+w4×P4j,得到每种预测类型的概率为[y1 y2 y3 y4 y5 y6]1×6;

S4.5、选择y1至y6中最大值对应的预测类型作为最终预测类型标签,得到语音情感分类结果。

7.根据权利要求6所述的基于特征融合与集成学习的语音情感分类方法,其特征在于,所述步骤S4.1中分配的权重获取的具体方法为:S4.1.1、以[w1 w2 w3 w4]1×4为基础,构建softmax回归模型;

S4.1.2、设置softmax回归模型的训练批次为T,批次大小为L以及学习率为0.005;

S4.1.3、以每种分类器输出的每种预测类型概率组成矩阵,将矩阵作为样本,采集若干样本;

S4.1.4、根据若干样本,以交叉损失函数作为损失函数,并使用Adam算法对softmax回归模型训练;

S4.1.5、训练至损失函数收敛或达到训练轮次时,得到[w1 w2 w3 w4]1×4的最终值。

8.根据权利要求7所述的基于特征融合与集成学习的语音情感分类方法,其特征在于,所述构建softmax回归模型的具体步骤为:S4.1.1.1、令softmax回归模型的回归的权重W为:W=[w1 w2 w3 w4]1×4(d)

S4.1.1.2、设定样本d的特征x 为:(d) (d)

S4.1.1.3、以特征x 和权重W获取输出层的输出o 为:其中, 表示输出层对样本d的第j类预测类型的输出,j=1,2,3,4,5,6;

(d)

S4.1.1.4、对输出层的输出o 进行softmax运算,获取第j类预测类型的概率yj为:其中,k表示类别总数,exp(*)表示指数运算。