知嘟嘟-专利交易平台_专利购买_专利出售-买专利,上嘟嘟

欢迎来到知嘟嘟！联系电话：13095918853 卖家免费入驻，海量在线求购！卖家免费入驻，海量在线求购！

嘟嘟会员

帮助中心网站地图

查出售查高校查求购查年费

我要发布

首页转移热力图Hot 专利交易委托购买高校专区科技服务专利求购年费查询行业资讯

联系电话：13095918853

知嘟嘟经纪人

一种音频信号的增强方法及系统

￥29900

专利号： 2024111549707

申请人：青岛润恒益科技有限公司

专利类型：发明专利

专利状态：授权未缴费

专利领域：乐器；声学

更新日期：2025-04-02

缴费截止日期：暂无

价格&联系人

年费信息

委托购买

专利简介

专利详情

委托购买说明

需准备材料

常见问题

摘要:

权利要求书:

1.一种音频信号的增强系统，其特征在于：包括音频采集模块、音频量化模块、校验模块、提取模块、处理模块和评估模块；

所述音频采集模块通过音频输入接口获取原始音频信号，并进行固定周期采样，将采样的连续的音频信号组成音频信号集；

所述音频量化模块对音频信号集进行处理，包括量化处理，将连续的音频振幅映射为离散的数字值，确定量化级别，包括16位和24位，组成数字音频信号集；

所述校验模块对数字音频信号集进行预处理校验，校验包括信号失真校验和信号丢失校验；

所述提取模块对校验后的数字音频信号集执行分帧处理，获取数字音频分帧数据组，并进行特征提取，包括短时能量特征、过零率特征和梅尔频率倒谱特征，再进行整合，包括：短时能量特征信息整合成第一数据集，过零率特征信息整合成第二数据集，梅尔频率倒谱特征信息整合成第三数据集；

所述处理模块对第一数据集、第二数据集和第三数据集进行归一化处理，并进行拟合，使用深度学习技术进行建立数字音频信号模型，在训练和分析后获取：音频信号评估指数Pgzs；

所述音频信号评估指数Pgzs通过以下计算公式获取：

式中，Dsxs表示短时能量系数、Glxs表示过零率系数、Plxs表示梅尔频率倒谱系数，p1、p2和p3分别表示短时能量系数Dsxs、过零率系数Glxs和梅尔频率倒谱系数Plxs的比例系数，C表示第一修正常数；

所述短时能量系数Dsxs通过第一数据计算获取，并与预设的短时能量阈值D进行匹配，获取短时能量音频方案；

所述过零率系数Glxs通过第二数据集计算获取，并与预设的过零率阈值G进行匹配，获取过零率音频方案；

所述梅尔频率倒谱系数Plxs通过第三数据集计算获取；

所述评估模块通过预设的音频信号阈值Y与音频信号评估指数Pgzs进行对比，获取音频信号调整策略方案。

2.根据权利要求1所述的一种音频信号的增强系统，其特征在于：所述音频采集模块包括输入接口单元和采样单元；

所述输入接口单元用于与外部音频设备进行通信和连接，通过音频输入接口获取原始音频信号，连接包括：麦克风和音频输入设备；

所述采样单元对获取的原始音频信号进行固定周期的采样，形成离散的音频样本，并对连续的音频样本进行组合，获取音频信号集。

3.根据权利要求1所述的一种音频信号的增强系统，其特征在于：所述音频量化模块包括量化单元和量化级别确定单元；

所述量化单元通过线性量化方法和设置的量化位数，包括16位和24位，对音频信号集进行振幅量化处理，将连续的音频振幅映射为离散的数字值，进而组成数字音频信号集；

所述量化级别确定单元用于设置量化的位数，确定每个样本的数字表示范围，根据具体需求，选择不同的位数，包括16位或24位，以定义数字音频信号集的精度。

4.根据权利要求1所述的一种音频信号的增强系统，其特征在于：所述校验模块包括失真验证单元和丢失验证单元；

所述失真验证单元负责对数字音频信号集进行失真校验，包括采用校验技术和差错编码技术进行检测是否存在信号失真情况；

所述丢失验证单元负责对数字音频信号集进行丢失验证，包括通过比较接收到的数字音频信号与预设的信号序列，检测是否存在信号丢失情况。

5.根据权利要求3所述的一种音频信号的增强系统，其特征在于：所述提取模块包括提取单元和整合单元；

所述提取单元通过对校验后的数字音频信号集执行分帧处理，进而组成数字音频分帧数据组，再进行提取短时能量特征、过零率特征和梅尔频率倒谱特征；

短时能量特征包括：音频样本振幅值；

过零率特征包括：振幅值经过零值为正相位的次数和振幅值经过零值为负相位的次数；

梅尔频率倒谱特征包括：梅尔滤波器的带宽、梅尔频率度量和滤波器组的输出能量值；

所述整合单元将提取的特征信息整合成三个数据集，包括短时能量特征整合成第一数据集、过零率特征整合成第二数据集和梅尔频率倒谱特征整合成第三数据集；

第一数据集包括：振幅值Zfz；

第二数据集包括：正相位次数值Zxw和负相位次数值Fxw；

第三数据集包括：音频信号总能量值Scnl和音频信号平均输出能量值Pjnl。

6.根据权利要求5所述的一种音频信号的增强系统，其特征在于：所述处理模块包括建模单元；

所述建模单元对第一数据集、第二数据集和第三数据集进行归一化处理，在拟合后使用深度学习技术进行建立数字音频信号模型，在训练和分析后获取：短时能量系数Dsxs、过零率系数Glxs和梅尔频率倒谱系数Plxs，再将短时能量系数Dsxs、过零率系数Glxs和梅尔频率倒谱系数Plxs进行关联，获取：音频信号评估指数Pgzs。

7.根据权利要求5所述的一种音频信号的增强系统，其特征在于：所述短时能量系数Dsxs通过以下计算公式获取：式中，N表示数字音频分帧数据组总数，i＝1表示数字音频分帧数据组中第1分帧音频样本，i表示数字音频分帧数据组总数中具体的第i分帧音频样本，i(Zfz)表示第1分帧音频样本的振幅值，Zfz表示振幅值，通过计算音频样本的振幅值Zfz，获取音频信号中的存在强度波动的表现状态：短时能量系数Dsxs；

并与预设的短时能量阈值D进行匹配，获取短时能量音频方案：

短时能量系数Dsxs＜短时能量阈值D，获取短时能量音频窗口内不存在强度波动方案结果；

短时能量系数Dsxs≥短时能量阈值D，获取短时能量音频窗口内存在强度波动方案结果；

所述过零率系数Glx通过以下计算公式获取：

式中，N表示数字音频分帧数据组总数，i＝1表示数字音频分帧数据组中第1分帧音频样本，i表示数字音频分帧数据组总数中具体的第i分帧音频样本，sign(i-1(Zxw+Fxw))表示第i-1分帧音频样本的正相位次数值Zxw和负相位次数值Fxw的和正负号，sign(i(Zxw+Fxw))表示第i分帧音频样本的正相位次数值Zxw和负相位次数值Fxw的和正负号，正负号具体为当sign(i(Zxw+Fxw))的和＜0时返回-1，当sign(i(Zxw+Fxw))的和＝0时返回0，当sign(i(Zxw+Fxw))的和＞0时返回1，通过计算相邻的分帧音频样本的正相位次数值Zxw和负相位次数值Fxw绝对值差，获取音频信号中的浊声和清声的特征表现：过零率系数Glx；

并与预设的过零率阈值G进行匹配，获取过零率音频方案：

零率系数Glx＜过零率阈值G，获取音频窗口内存在浊音方案结果；

零率系数Glx≥过零率阈值G，获取音频窗口内存在清音方案结果。

8.根据权利要求1所述的一种音频信号的增强系统，其特征在于：所述梅尔频率倒谱系数Plxs通过以下计算公式获取：式中，N表示数字音频分帧数据组总数，i＝1表示数字音频分帧数据组中第1分帧音频样本，i表示数字音频分帧数据组总数中具体的第i分帧音频样本，Scnl表示音频信号总能量值，Pjnl表示音频信号平均输出能量值，log(i(Scnl)|+|i(Pjnl))表示音频信号总能量值Scnl与音频信号平均输出能量值Pjnl绝对值和的对数值，通过音频信号总能量值Scnl的计算，获取模拟了人类听觉对音频频率和音频强度的感知状态表现：梅尔频率倒谱系数Plxs。

9.根据权利要求1所述的一种音频信号的增强系统，其特征在于：所述评估模块包括存储单元和匹配单元；

所述存储单元用于存储短时能量阈值D、短时能量音频方案、过零率阈值G、零率音频方案、音频信号阈值Y、音频信号调整策略方案、相关音频增强调整方式和相关提示通知方式；

所述匹配单元通过预设的相关信息与需要的对比值进行匹配，包括预设的音频信号阈值Y与音频信号评估指数Pgzs进行对比，获取音频信号调整策略方案：音频信号评估指数Pgzs＜音频信号阈值Y，获取音频信号不调整策略方案结果；

音频信号评估指数Pgzs≥音频信号阈值Y，获取音频信号调整策略方案结果，调整包括：降噪调整、增强滤波调整、回声调整、语言增强调整和频谱平滑调整。

10.一种音频信号的增强方法，包括上述权利要求1～9任一项所述的一种音频信号的增强系统，其特征在于：包括以下步骤：步骤一：通过音频采集模块通过音频输入接口获取原始音频信号，并进行固定周期采样，组成音频信号集；

步骤二：通过音频量化模块对音频信号集进行处理，包括量化处理，将连续的音频振幅映射为离散的数字值，组成数字音频信号集；

步骤三：通过校验模块对数字音频信号集进行预处理校验，校验包括信号失真校验和信号丢失校验；

步骤四：通过提取模块对校验后的数字音频信号集执行分帧处理，获取数字音频分帧数据组，并进行特征提取，包括短时能量特征、过零率特征和梅尔频率倒谱特征，再进行整合，包括：短时能量特征信息整合成第一数据集，过零率特征信息整合成第二数据集，梅尔频率倒谱特征信息整合成第三数据集；

步骤五：通过处理模块对第一数据集、第二数据集和第三数据集进行归一化处理，并进行拟合，使用深度学习技术进行建立数字音频信号模型，在训练和分析后获取：音频信号评估指数Pgzs；

步骤六：通过评估模块通过预设的音频信号阈值Y与音频信号评估指数Pgzs进行对比，获取音频信号调整策略方案。