1.一种发音异常检测方法,其特征在于:包括语音信号预处理模块、语音时频同窗可视化模块、局部信息统计模块和分类模块,所述语音信号预处理模块将待测的语音信号进行处理,处理后传输至所述语音时频同窗可视化模块,所述语音时频同窗可视化模块将处理后语音信号的时域信息和频域信息进行同窗可视化显示,并将显示信息传输至所述局部信息统计模块,所述局部信息统计模块进行计算并且统计单位区间内各数据的特征信息,并将其统计的特征信息传递给所述分类模块,所述的分类模块是将统计的高维数据经过多次映射关系进行类别划分,通过训练分类器,从而实现对病态语音信号的检测;
所述语音信号预处理模块利用端点检测找到语音信号的起始点,然后将语音信号中持续时间不少于T秒的连续发音作为有效部分进行选取,选取的连续语音信号用x(t)表示;
所述局部信息统计模块构建方法如下:Υ Υ
(1)、将可视化数据规范为I'(x,y)=I(x,y) ,I(x,y) 表示将I(x,y)指数化,其中Υ表示其指数的值,I'(x,y)表示规范化后的二维数据;
(2)、将数据通过滑动窗口进行截取,窗口的大小为η×η,η为整数;
(3)、计算所述滑动窗口内每个数据的幅值大小其中x、y分别表示二维数据的
横坐标、纵坐标位置,p表示不同的距离,p≥1,当p=1时,为曼哈顿距离,当p=2时,为欧式距离,S(I′(x,y))表示坐标位置为x、y的数据的幅值;
(4)、计算每个数据的角度表达式如下:θ(I'(x,y))=arctant(Δy/Δx),其中Δy=I'(x,y+1)‑I'(x,y‑1),Δx=I'(x+1,y)‑I'(x‑1,y);θ(I'(x,y))表示该数据的角度,Δy表示数据的竖直分量,Δx表示数据的水平分量;
(5)、统计单位方向内的幅值,将360°划分为w个方向区间,将滑动窗口内所有数据的幅值根据其角度所在的方向区间进行统计,然后将每个方向区间内的所有幅值相加,统计后得到w维向量;
(6)、将w维向量进行归一化,表达式如下所示: 其中v表示w维向量,v*表示w维向量归一化的结果,ε为一个很小的不为零常数,||v||1表示为v的1范数;
(7)、通过滑动窗口滑动后,重复步骤(3)‑(6),直至窗口遍历完所有的数据,最终得到m维特征向量。
2.根据权利要求1所述的发音异常检测方法,其特征在于:所述语音时频同窗可视化模块构建方法具体包括以下步骤:
(1)、对语音信号x(t)进行采样,采样频率为f,得到离散语音信号xf(n),n为整数;
(2)、对所述离散语音信号xf(n)进行截断处理,表达式如下:xw(n)=xf(n)×w(n),其中xw(n)表示截断后的离散语音信号,w(n)表示截断函数;
(3)、将所述截断后的离散语音信号xw(n)进一步变换,采用傅里叶变换,获得表达式其中N表示截断函数w(n)的长度,Xz(k)表示其幅度谱估计,k为整数;
2
(4)、计算其功率谱函数P(k)=10lg|Xz(k)|;
(5)、对P(k)进行归一化处理得到P'(k),然后通过非线性映射Φ得到最终的数据,表达式如下:I=φ(P′(k)),其中I表示经过映射后的可视的二维数据,I(x,y)表示二维数据中坐标为x,y的数据。
3.根据权利要求1所述的发音异常检测方法,其特征在于:所述分类模块使用SVM分类器进行二分类,在训练阶段,首先将所有数据集中的每个语音的m维特征向量和其对应的标签传输至SVM分类器中,然后训练SVM分类器;在检测阶段,将被检测语音的m维特征向量传输至训练好的SVM分类器,从而得到该被检测语音的分类结果即是否患病。