欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2020105636521
申请人: 杭州电子科技大学
专利类型:发明专利
专利状态:已下证
专利领域: 乐器;声学
更新日期:2024-01-05
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.基于特征集融合的语音情感识别及评价方法,其特征在于,具体包括以下步骤:步骤一:从语音数据库中读取.wav语音文件,对语音文件预处理后提取N种语音特征集;

步骤二:建立Stacking学习模型;

通过初级学习器融合N种语音特征集,并建立Stacking学习模型的次级学习器,通过次级学习器对融合后的语音特征集做最终的语音情感识别预测;

将得到的语音特征集切分为训练数据和测试数据,分别为Training Data、Test Data;

采用K折交叉验证来切分训练数据得到Train1,Train2...Traink;此时初级学习器要做K次训练和预测;

使用训练数据中的Train2,Train3...Traink做为训练集Set1,Train1做为验证集,基于训练集Set1训练初级学习器,预测得到验证集Train1的预测结果Val1,同时预测得到测试集Test的预测结果Test1;

使用训练数据中的Train1,Train3...Traink做为训练集Set2,Train2做为验证集,基于训练集Set2训练初级学习器,预测得到验证集Train2的预测结果Val2,同时预测得到测试集Test的预测结果Test2;

同理分别预测得到验证集Train3,Train4...Traink的预测结果Val3,Val4...Valk,同时分别预测得到测试集Test的预测结果Test3,Test4...Testk;

将得到的Val1,Val2...Valk进行矩阵拼接,得到1列的Val数据;将此Val数据作为次级学习器的训练数据;

对Test1,Test2...Testk求取平均值得到Testavg,将Testavg作为次级学习器的测试数据;

N种语音情感特征的训练数据经过Stacking的初级学习器预测后得到N列数据,并将此数据作为次级学习器的训练数据;

N种语音情感特征集的测试数据经过Stacking的初级学习器预测后得到N列数据,并将此数据作为次级学习器的测试数据;

将次级学习器的训练数据作为次级学习器的训练数据,经训练后通过次级学习器的测试数据来验证次级学习器的预测结果;

步骤三:建立评价标准,通过Stacking学习模型得到的预测结果与真实结果进行计算,得到评价该模型的评价标准;

平均绝对误差

其中m,yi, 分别为测试集样本个数、测试集真实值及测试集预测值;该指标计算用于评估预测结果和真实数据集的接近程度的程度,其值越小说明拟合效果越好;

均方差

其中m,yi, 分别为测试集样本个数、测试集真实值及测试集预测值;该指标计算的是拟合数据和原始数据对应样本点的误差的平方和的均值,其值越小说明拟合效果越好;

判定系数

其中m,yi, 分别为测试集样本个数、测试集真实值、测试集预测值及测试集真实值的平均值;其含义是也是解释回归模型的方差得分,其值取值范围是[0,1],越接近于1说明自变量越能解释因变量的方差变化,值越小则说明效果越差;

皮尔逊相关系数

其含义是计算测试集真实值与测试集预测值的相关度,相关系数在[-1,1]之间,Pcc值越大,表示相关系数越显著。

2.根据权利要求1所述的基于特征集融合的语音情感识别方法,其特征在于:步骤一中提取的语音特征集,具体为:Opensmile工具包提取IS09_emotion、IS10_paraling、IS11_speaker_state、IS12_speaker_trait四种语音特征集。