欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2015104567576
申请人: 百度在线网络技术(北京)有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 电通信技术
更新日期:2024-02-23
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种在网络业务中执行语音通信的方法,其特征在于,所述方法包括,在执行所述网络业务的业务服务器中执行以下步骤:通过第一线程从智能终端设备接收发送给目标用户的语音数据,并且将包括所述语音数据和识别结果接收位置的语音识别请求发送给语音识别服务器;

通过第二线程将在所述识别结果接收位置接收到的识别文本数据发送给所述目标用户的智能终端设备。

2.根据权利要求1所述的方法,其特征在于,所述通过第一线程将包括所述语音数据和识别结果接收位置的语音识别请求发送给语音识别服务器的处理包括:通过所述第一线程将所述语音数据和用于接收所述语音数据的识别结果的回调网页链接封装在HTTP/HTTPS请求中,并且将所述HTTP/HTTPS请求发送给所述语音识别服务器,其中,在所述回调网页链接中包括所述目标用户的信息。

3.根据权利要求2所述的方法,其特征在于,所述方法还包括:通过第三线程将通过所述回调网页链接接收到的第一识别文本数据以及所述回调网页链接中包含的第一目标用户的信息写入识别结果队列中,所述通过第二线程将在所述识别结果接收位置接收到的所述识别文本数据发送给所述目标用户的智能终端设备的处理包括:从所述识别结果队列读取第二识别文本数据和相应的第二目标用户的信息,并且将所述第二识别文本数据发送给所述第二目标用户的智能终端设备。

4.根据权利要求3所述的方法,其特征在于,通过线程同步机制控制第三线程对所述识别结果队列的写入操作和第二线程对所述识别结果队列的读取操作。

5.根据权利要求4所述的方法,其特征在于,所述将所述第二识别文本数据发送给所述第二目标用户的智能终端设备的处理还包括:将所述第二识别文本数据和与其相应的语音数据发送给所述第二目标用户的智能终端设备。

6.根据权利要求1所述的方法,其特征在于,所述通过第一线程将包括所述语音数据和识别结果接收位置的语音识别请求发送给语音识别服务器的处理包括:通过第一线程根据预先设定的预处理参数对所述语音数据执行预处理,得到预处理后的语音数据,其中,所述预处理参数包括语音格式和语音采样率;

将包括所述预处理后的语音数据和识别结果接收位置的语音识别请求发送给语音识别服务器。

7.一种在网络业务中执行语音通信的方法,其特征在于,所述方法包括:语音识别请求接收步骤:从业务服务器接收包括发送给目标用户的语音数据和识别结果接收位置的语音识别请求;

语音识别执行步骤:将所述语音数据转换为识别文本数据;

识别文本数据发送步骤:将包括所述识别文本数据的语音识别响应发送至所述识别结果接收位置,以通过所述业务服务器将接收到的识别文本数据发送给所述目标用户的智能终端设备。

8.根据权利要求7所述的方法,其特征在于,所述语音识别请求是包括所述语音数据和用于接收所述语音数据的识别结果的回调网页链接的HTTP/HTTPS请求,其中,所述回调网页链接中包括所述目标用户的信息,所述识别文本数据发送步骤的处理包括:

根据所述回调网页链接,将包括所述识别文本数据和所述目标用户的信息的HTTP/HTTPS响应发送给所述回调网页链接对应的业务服务器。

9.根据权利要求8所述的方法,其特征在于,所述语音识别执行步骤的处理包括:如果所述语音数据的语音时长超过预设的时长阈值,则根据预先建立的语音切分模型将所述语音数据切分为多个语音数据段,分别将所述多个语音数据段转换为短识别文本数据,并且将所述短识别文本数据组合成所述识别文本数据;

如果所述语音数据的语音时长没有超过所述时长阈值,则直接将所述语音数据识别为所述识别文本数据。

10.根据权利要求9所述的方法,其特征在于,所述方法还包括:如果在预定的时间区间内从所述业务服务器接收的语音数据超过预定的数据量,则将所述语音识别请求放置在待识别语音数据队列中,通过单独的线程从所述待识别语音数据队列提取语音识别请求,并且对提取的所述语音识别请求执行所述语音识别执行步骤和识别文本数据发送步骤的处理。

11.根据权利要求10所述的方法,其特征在于,所述通过单独的线程从所述待识别语音数据队列提取语音识别请求的处理还包括:如果提取的语音识别请求在所述待识别语音数据队列中等待被处理是时间长度超过预定的等待时间阈值,则丢弃所述语音识别请求。

12.根据权利要求7所述的方法,其特征在于,所述方法还包括:根据预先设定的预处理参数对所述语音数据执行预处理,得到预处理后的语音数据,其中,所述预处理参数包括语音格式和语音采样率;

所述语音识别执行步骤的处理包括:

将所述预处理后的语音数据转换为识别文本数据。

13.一种在网络业务中执行语音通信的方法,其特征在于,所述方法包括:从业务服务器接收来自所述网络业务中另一用户的识别文本数据;

显示所述识别文本数据。

14.根据权利要求13所述的方法,其特征在于,所述从业务服务器接收来自所述网络业务中另一用户的识别文本数据的处理还包括:从业务服务器接收与所述识别文本数据相应的语音数据;

所述显示所述识别文本数据的处理包括:

显示用于播放所述语音数据的语音播放按键,并在所述语音播放按键周围的预设位置显示来自所述网络业务中另一用户的识别文本数据。

15.一种用于在网络业务中执行语音通信的服务器,其特征在于,所述服务器包括:语音数据收发模块,用于通过第一线程从智能终端设备接收发送给目标用户的语音数据,并且将包括所述语音数据和识别结果接收位置的语音识别请求发送给语音识别服务器;

文本数据发送模块,用于通过第二线程将在所述识别结果接收位置接收到的识别文本数据发送给所述目标用户的智能终端设备。

16.根据权利要求15所述的服务器,其特征在于,所述语音数据收发模块用于:通过所述第一线程将所述语音数据和用于接收所述语音数据的识别结果的回调网页链接封装在HTTP/HTTPS请求中,并且将所述HTTP/HTTPS请求发送给所述语音识别服务器,其中,在所述回调网页链接中包括所述目标用户的信息。

17.根据权利要求16所述的服务器,其特征在于,所述服务器还包括:用户信息写入模块,用于通过第三线程将通过所述回调网页链接接收到的第一识别文本数据以及所述回调网页链接中包含的第一目标用户的信息写入识别结果队列中,所述文本数据发送模块用于从所述识别结果队列读取第二识别文本数据和相应的第二目标用户的信息,并且将所述第二识别文本数据发送给所述第二目标用户的智能终端设备。

18.根据权利要求17所述的服务器,其特征在于,通过线程同步机制控制第三线程对所述识别结果队列的写入操作和第二线程对所述识别结果队列的读取操作。

19.根据权利要求18所述的服务器,其特征在于,所述所述文本数据发送模块用于:将所述第二识别文本数据和与其相应的语音数据发送给所述第二目标用户的智能终端设备。

20.根据权利要求15所述的服务器,其特征在于,所述语音数据收发模块包括:预处理单元,用于通过第一线程根据预先设定的预处理参数对所述语音数据执行预处理,得到预处理后的语音数据,其中,所述预处理参数包括语音格式和语音采样率;

语音数据发送单元,用于将包括所述预处理后的语音数据和识别结果接收位置的语音识别请求发送给语音识别服务器。

21.一种用于在网络业务中执行语音通信的服务器,其特征在于,所述服务器包括:识别请求接收模块,用于从业务服务器接收包括发送给目标用户的语音数据和识别结果接收位置的语音识别请求;

语音识别执行模块,用于将所述语音数据转换为识别文本数据;

文本数据发送模块,用于将包括所述识别文本数据的语音识别响应发送至所述识别结果接收位置,以通过所述业务服务器将接收到的识别文本数据发送给所述目标用户的智能终端设备。

22.根据权利要求21所述的服务器,其特征在于,所述语音识别请求是包括所述语音数据和用于接收所述语音数据的识别结果的回调网页链接的HTTP/HTTPS请求,其中,所述回调网页链接中包括所述目标用户的信息,所述文本数据发送模块用于:

根据所述回调网页链接,将包括所述识别文本数据和所述目标用户的信息的HTTP/HTTPS响应发送给所述回调网页链接对应的业务服务器。

23.根据权利要求22所述的服务器,其特征在于,所述语音识别执行模块用于:如果所述语音数据的语音时长超过预设的时长阈值,则根据预先建立的语音切分模型将所述语音数据切分为多个语音数据段,分别将所述多个语音数据段转换为短识别文本数据,并且将所述短识别文本数据组合成所述识别文本数据;

如果所述语音数据的语音时长没有超过所述时长阈值,则直接将所述语音数据识别为所述识别文本数据。

24.根据权利要求23所述的服务器,其特征在于,所述服务器还包括:识别请求放置模块,用于如果在预定的时间区间内从所述业务服务器接收的语音数据超过预定的数据量,则将所述语音识别请求放置在待识别语音数据队列中,语音识别处理模块,用于通过单独的线程从所述待识别语音数据队列提取语音识别请求,并且对提取的所述语音识别请求执行所述语音识别执行步骤和识别文本数据发送步骤的处理。

25.根据权利要求24所述的服务器,其特征在于,所述语音识别处理模块用于:如果提取的语音识别请求在所述待识别语音数据队列中等待被处理是时间长度超过预定的等待时间阈值,则丢弃所述语音识别请求。

26.根据权利要求21所述的服务器,其特征在于,所述服务器还包括:预处理模块,用于根据预先设定的预处理参数对所述语音数据执行预处理,得到预处理后的语音数据,其中,所述预处理参数包括语音格式和语音采样率;

所述语音识别执行模块用于:

将所述预处理后的语音数据转换为识别文本数据。

27.一种用于在网络业务中执行语音通信的智能终端设备,其特征在于,所述智能终端设备包括:文本数据接收模块,用于从业务服务器接收来自所述网络业务中另一用户的识别文本数据;

文本数据显示模块,用于显示所述识别文本数据。

28.根据权利要求27所述的智能终端设备,其特征在于,所述文本数据接收模块还用于:从业务服务器接收与所述识别文本数据相应的语音数据;

所述文本数据显示模块用于:

显示用于播放所述语音数据的语音播放按键,并在所述语音播放按键周围的预设位置显示来自所述网络业务中另一用户的识别文本数据。