欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2016101318097
申请人: 江苏信息职业技术学院
专利类型:发明专利
专利状态:已下证
专利领域: 乐器;声学
更新日期:2024-01-05
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种融合韵律信息的汉语方言辨识方法,其特征在于,包括:s1、输入汉语方言信号进行语音信号提取,提取信号包括声学特征和韵律特征,所述声学特征包括SDC特征,所述韵律特征包括基频特征、能量包络特征和时长特征;

s2、将提取的不同质的特征经过模型建模,转化成具有统一度量标准的特征矢量,然后进行组合构成一个统一矢量送分类器决策。

2.根据权利要求1所述的融合韵律信息的汉语方言辨识方法,其特征在于:所述SDC特征的计算由4个整型参数决定,即(N,d,P,k),其中N是每帧中倒谱特征的维数,d是计算差分倒谱的差分时间,P是k个倒谱块之间的转移时间,k是构成一个SDC特征的倒谱块的个数,在t帧第j个SDC特征的计算公式是:Δcj,t=cj,(t+d)-cj,(t-d)cj,t在t帧的第j个MFFCC特征参数,所以在t帧时SDC的特征可表示为:每帧SDC特征向量的维数为N×k维。

3.根据权利要求1所述的融合韵律信息的汉语方言辨识方法,其特征在于:所述基频特征中,基音频率包含在语音信号的浊音段中,浊音信号的每一帧可以写成:其中,n=0,…,N-1,N是每一帧语音的样本点数,I是拟合的谐波数,αi,ωi,分别是描述第i个谐波的幅度、频率和相位,该信号x(n)的自相关为:其中,τ=0,…,N-1,定义相邻两帧信号的自相关协方差为该帧语音的基频流特征:其中,μt(τ)=E{Rt(τ)},d∈(N/2,N/2]是特征矢量的下标,令:其中,δi=ωt,i-ωt+1,i,Δ={δi,i=1,…,I},通过求导得到,假设分帧后的语音信号为 相邻两帧语音信号记为:xt(n),xt+1(n),n=0,1,…N-1。

4.根据权利要求3所述的融合韵律信息的汉语方言辨识方法,其特征在于:基音特征流的具体计算方法包括:(i)利用傅里叶变换(DFT)计算各帧的功率谱密度:Pt(k)=|DFT(xt(n))|2

其中,k=0,1,…K-1.

(ii)对所得的功率谱密度进行平滑处理:

Pt(k)=Pt(k)·W(k)

其中,窗函数为:W(k)=1+cos(2πk/K)(iii)归一化平滑后的功率谱密度:

(iv)计算归一化能量谱的逆傅里叶变换(IDFT):Rt(k)=DFT-1(Pt(k))

(v)则基频流特征为:

其中C是归一化常数,特征矢量下标的取值范围是:-D≤d≤D。

5.根据权利要求3所述的融合韵律信息的汉语方言辨识方法,其特征在于:所述能量包络特征中,语音信号各帧的能量参数记为:E={e1,e2,…,eN},其中,ei为:

6.根据权利要求1所述的融合韵律信息的汉语方言辨识方法,其特征在于:所述时长特征 中,对能量特征矢量作差分,然后检查差分能量中变号的次数以及两次变号间隔,将变号次数及平均变号间隔作为时长特征。

7.根据权利要求1所述的融合韵律信息的汉语方言辨识方法,其特征在于:所述步骤s2中,采用模型融合的方法进行特征融合,计算每种特征在方言的高斯混合模型和语言模型下的概率分数。

8.根据权利要求7所述的融合韵律信息的汉语方言辨识方法,其特征在于:在高斯混合模型下,设语音信号经特征提取后为 是第t帧的语音特征矢量,T为该语音段总的帧数,则该语音段在第k个方言GMM模型下的输出概率为:其中,M为高斯混合元数目,也是符号总数,

表示第k个方言的GMM符号化模型。

表示该模型第j个高斯混合分量的加权值, 分别表示该模型第j个高斯混合分量的均值和协方差矩阵, 。

9.根据权利要求7所述的融合韵律信息的汉语方言辨识方法,其特征在于:在语言模型下,首先采用插值法对数据进行平滑处理,然后建立各种语言的二元插值语言模型,其算法如下:设经过第k个GMM模型下得到的语音符号串为: 表示第k个GMM模型下,第i帧语音的符号,i=1,2,…,T,k=1,2,…,N,N表示方言总数,T为总的语音帧数,则它在第i个方言语言模型下得到的对数似然为:其中,

10.根据权利要求1所述的融合韵律信息的汉语方言辨识方法,其特征在于:所述步骤s2中,分类器设计中采用的是支持矢量机,最优分类函数的算法如下:d

给定样本训练集X={(x1,y1),(x2,y2),…,(xn,yn)},X∈R,y∈Y={+1,-1},求解最优超平面可以转化为以下最优化问题,式中,xi表示样本特征矢量,参数w和b决定超平面位置的两个参数,使分类间隔最大,该优化问题可以转化为其对偶问题求解,解得最优分类函数为:

对于两类非线性可分问题,可以通过引入核函数将其转化为高维空间的线性可分问题,通过引入松弛变量转化成下列优化问题:其中,C为常数,表示对错分样本的惩罚大小, 表示发生错误分类的量;

其对应的对偶问题为:

其中,αi为与每个样本对应的Lagrange乘子,K(xi,xj)为满足Mercer条件的核函数,最终解得的最优分类函数是: