1.一种识别AI来电的方法,其特征在于,该方法包括以下步骤:
步骤101、终端接收到来电呼叫时,语音助手自动接通来电;
步骤102、获取来电的语音信号,对语音信号进行预处理;
步骤103、利用数据库对预处理后的语音信号进行分析判断,识别该来电是否属于AI来电。
2.根据权利要求1所述的方法,其特征在于,
步骤102具体包括:语音助手获取来电的语音信号,滤除语音信号中的噪声值。
3.根据权利要求1或2所述的方法,其特征在于,在步骤103之前,预先建立数据库,其中包括以下步骤:步骤1、获取多个真人语音样本以及多个AI语音样本,形成语料库;
步骤2、对真人语音样本、AI语音样本按照完整语意、词组两个维度进行切分,形成真人语音段、AI语音段,分别提取两种语音段的长期频谱特征The Long Term Average Spectrum(LTAS),获取LTAS的基频特征,根据LTAS中的基频特征确定两种语音段的音调;其中完整语意切分粒度大于或等于词组切分粒度;
步骤3、分别识别真人语音段、AI语音段的音素序列,根据各音素的变化位置确定每个音素的发音时间长度,得出两种语音段的发音节奏;
步骤4、建立数据库,将语音段转换为文本,以该文本为索引,存储对应的真人语音段、AI语音段的LTAS的基频特征、音调、音素的发音时间长度以及对应的节奏这四个特征参数;
其中一个文本可对应于一个或多个真人语音段、一个或多个AI语音段。
4.根据权利要求3所述的方法,其特征在于,由云服务器或者终端预先建立数据库,数据库存储于云服务器或者终端。
5.根据权利要求3所述的方法,其特征在于,利用数据库对预处理后的语音信号进行分析判断,识别该来电是否属于AI来电,具体包括以下步骤:步骤1031、将预处理后的语音信号按照完整语意进行切分,将切分后的语音段转换为文本,以该文本为索引,查找数据库中是否存在该文本索引,执行步骤1032;
步骤1032、若数据库中存在对应的文本,获取切分后的语音段对应的LTAS的基频特征及与其对应的音调、音素的发音时间长度以及对应的节奏这四个特征参数;将切分后的语音段对应的LTAS的基频特征及与其对应的音调、音素的发音时间长度以及对应的节奏分别与数据库中该文本索引对应的真人语音段、AI语音段的LTAS的基频特征、音调、音素的发音时间长度、节奏这四个特征参数进行比较,计算切分后的语音段的四个特征参数分别与真人语音、AI语音的四个特征参数的相似度;当数据库中该文本对应于多个真人语音段、和/或多个AI语音段时,将切分后的语音段的四个特征参数分别与数据库中的每个真人语音段、AI语音段的四个特征参数进行相似度计算,并执行步骤1033;若数据库中不存在对应的文本,将预处理后的语音信号按照词组进行切分,获取按照词组切分后的语音段对应的LTAS的基频特征及与其对应的音调、音素的发音时间长度以及对应的节奏这四个特征参数,并执行步骤1034;
步骤1033、当按照语意和/或按照词组切分后的语音段的四个特征参数与真人语音段/AI语音段的四个特征参数比较后的每个特征参数的相似度均高于预设值时,为该语音段的真人属性/AI属性赋值1+a(N-1),否则赋值0;其中N为按照语意和/或按照词组切分后的语音段与多个真人语音段/多个AI语音段的比较中每个特征参数的相似度均高于预设值时真人语音段/AI语音段的个数,a为权重因子,a为正数;执行步骤1035;
步骤1034、将按照词组切分后的语音段转换为文本,以该文本为索引,查找数据库中对应于该文本的真人语音段、AI语音段的LTAS的基频特征、音调、音素的发音时间长度、节奏这四个特征参数;将按照词组切分后的语音段的四个特征参数分别与数据库中该文本索引对应的真人语音段、AI语音段的LTAS的基频特征、音调、音素的发音时间长度、节奏进行比较,计算切分后的语音段的四个特征参数分别与真人语音、AI语音的四个特征参数的相似度;当数据库中该文本对应于多个真人语音段、和/或AI语音段时,将切分后的语音段的四个特征参数分别与数据库中的每个真人语音、AI语音的四个特征参数进行相似度计算,并执行步骤1033;
步骤1035、对来电的语音信号对应的语音段中真人属性、AI属性分别求和,当真人属性的和值大于AI属性的和值,则判断该来电属于真人来电,否则为AI来电,结束;若真人属性的和值与AI属性的和值相同,则执行步骤1036;
步骤1036、语音助手播放预设语音,与来电进行对话,如向来电提问等;判断来电的回复是否与预设语音内容相关,若相关,则对回复的语音信号进行预处理,执行步骤1031;否则判断其为AI来电,结束。
6.根据权利要求1所述的方法,其特征在于,在步骤103之后,进一步包括步骤104,当来电被识别为AI语音来电时,语音助手直接结束通话。
7.根据权利要求1-6任一项所述的方法,其特征在于,
在步骤101中,语音助手判断是否满足自动接通来电的条件,当满足条件时,接通来电。
8.根据权利要求1-7所述的方法,其特征在于,
所述语音助手为云语音助手。
9.一种识别AI来电的装置,其特征在于,该装置包括接听模块、预处理模块、识别模块;
其中,
接听模块,用于当终端接收到来电呼叫时,自动接通来电;
预处理模块,用于获取来电的语音信号,对语音信号进行预处理;
识别模块,用于利用数据库对预处理后的语音信号进行分析判断,识别该来电是否属于AI来电。
10.根据权利要求9所述的装置,其特征在于,
该装置还包括设置模块,用于设置接听模块自动接通来电的条件,当满足自动接通来电的条件时,接听模块则自动接通该来电。
11.根据权利要求9或10所述的装置,其特征在于,
该装置还包括统计分析模块,用于执行以下步骤:
步骤1、获取多个真人语音样本以及多个AI语音样本,形成语料库;
步骤2、对真人语音样本、AI语音样本按照完整语意、词组两个维度进行切分,形成真人语音段、AI语音段,分别提取两种语音段的长期频谱特征The Long Term Average Spectrum(LTAS),获取LTAS的基频特征,根据LTAS中的基频特征确定两种语音段的音调;其中完整语意切分粒度大于或等于词组切分粒度;
步骤3、分别识别真人语音段、AI语音段的音素序列,根据各音素的变化位置确定每个音素的发音时间长度,得出两种语音段的发音节奏;
步骤4、建立数据库,将语音段转换为文本,以该文本为索引,存储对应的真人语音段、AI语音段的LTAS的基频特征、音调、音素的发音时间长度以及对应的节奏这四个特征参数。
其中一个文本可对应于一个或多个真人语音段、一个或多个AI语音段。
12.根据权利要求11所述的装置,其特征在于,该预处理模块和/或统计分析模块位于云服务器,或者位于终端。
13.根据权利要求11所述的装置,其特征在于,
识别模块具体用于:
步骤1031、将预处理后的语音信号按照完整语意进行切分,将切分后的语音段转换为文本,以该文本为索引,查找数据库中是否存在该文本索引,执行步骤1032;
步骤1032、若数据库中存在对应的文本,获取切分后的语音段对应的LTAS的基频特征及与其对应的音调、音素的发音时间长度以及对应的节奏这四个特征参数;将切分后的语音段对应的LTAS的基频特征及与其对应的音调、音素的发音时间长度以及对应的节奏分别与数据库中该文本索引对应的真人语音段、AI语音段的LTAS的基频特征、音调、音素的发音时间长度、节奏这四个特征参数进行比较,计算切分后的语音段的四个特征参数分别与真人语音、AI语音的四个特征参数的相似度;当数据库中该文本对应于多个真人语音段、和/或多个AI语音段时,将切分后的语音段的四个特征参数分别与数据库中的每个真人语音段、AI语音段的四个特征参数进行相似度计算,并执行步骤1033;若数据库中不存在对应的文本,将预处理后的语音信号按照词组进行切分,获取按照词组切分后的语音段对应的LTAS的基频特征及与其对应的音调、音素的发音时间长度以及对应的节奏这四个特征参数,并执行步骤1034;
步骤1033、当按照语意和/或按照词组切分后的语音段的四个特征参数与真人语音段/AI语音段的四个特征参数比较后的每个特征参数的相似度均高于预设值时,为该语音段的真人属性/AI属性赋值1+a(N-1),否则赋值0;其中N为按照语意和/或按照词组切分后的语音段与多个真人语音段/多个AI语音段的比较中每个特征参数的相似度均高于预设值时真人语音段/AI语音段的个数,a为权重因子,a为正数;执行步骤1035;
步骤1034、将按照词组切分后的语音段转换为文本,以该文本为索引,查找数据库中对应于该文本的真人语音段、AI语音段的LTAS的基频特征、音调、音素的发音时间长度、节奏这四个特征参数;将按照词组切分后的语音段的四个特征参数分别与数据库中该文本索引对应的真人语音段、AI语音段的LTAS的基频特征、音调、音素的发音时间长度、节奏进行比较,计算切分后的语音段的四个特征参数分别与真人语音、AI语音的四个特征参数的相似度;当数据库中该文本对应于多个真人语音段、和/或AI语音段时,将切分后的语音段的四个特征参数分别与数据库中的每个真人语音、AI语音的四个特征参数进行相似度计算,并执行步骤1033;
步骤1035、对来电的语音信号对应的语音段中真人属性、AI属性分别求和,当真人属性的和值大于AI属性的和值,则判断该来电属于真人来电,否则为AI来电,结束;若真人属性的和值与AI属性的和值相同,则执行步骤1036;
步骤1036、语音助手播放预设语音,与来电进行对话,如向来电提问等;判断来电的回复是否与预设语音内容相关,若相关,则对回复的语音信号进行预处理,执行步骤1031;否则判断其为AI来电,结束。
14.根据权利要求9所述的装置,其特征在于,当来电被识别为AI语音来电时,接听模块直接结束通话。
15.一种语音助手,其特征在于,包括如权利要求9-14之一所述的识别AI来电的装置。
16.根据权利要求15所述的语音助手,其特征在于,该语音助手为云语音助手。
17.一种终端,其特征在于该终端包括如权利要求15-16之一所述的语音助手。
18.一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器存储可被处理器执行的计算机指令,当处理器执行上述计算机指令时,实现如权利要求1-8所述的方法。
19.一种计算机可读存储介质,存储计算机指令,所述计算机指令用于实现如权利要求
1-8所述的方法。