知嘟嘟-专利交易平台_专利购买_专利出售-买专利,上嘟嘟

欢迎来到知嘟嘟！联系电话：13095918853 卖家免费入驻，海量在线求购！卖家免费入驻，海量在线求购！

嘟嘟会员

帮助中心网站地图

查出售查高校查求购查年费

我要发布

首页转移热力图Hot 专利交易委托购买高校专区科技服务专利求购年费查询行业资讯

联系电话：13095918853

知嘟嘟经纪人

执行语音通信的方法及服务器

￥28000

专利号： 2015104567576

申请人：百度在线网络技术(北京)有限公司

专利类型：发明专利

专利状态：已下证

专利领域：电通信技术

更新日期：2024-02-23

缴费截止日期：暂无

价格&联系人

年费信息

委托购买

专利简介

专利详情

委托购买说明

需准备材料

常见问题

摘要:

权利要求书:

1.一种在网络业务中执行语音通信的方法，其特征在于，所述方法包括，在执行所述网络业务的业务服务器中执行以下步骤：通过第一线程从智能终端设备接收发送给目标用户的语音数据，将所述语音数据和用于接收所述语音数据的识别结果的回调网页链接封装在HTTP/HTTPS请求中，并且将所述HTTP/HTTPS请求发送给语音识别服务器，其中，在所述回调网页链接中包括所述目标用户的信息；

通过第三线程将通过所述回调网页链接接收到的第一识别文本数据以及所述回调网页链接中包含的第一目标用户的信息写入识别结果队列中；

通过第二线程从所述识别结果队列读取第二识别文本数据和相应的第二目标用户的信息，并且将所述第二识别文本数据发送给所述第二目标用户的智能终端设备；

其中，通过线程同步机制控制第三线程对所述识别结果队列的写入操作和第二线程对所述识别结果队列的读取操作。

2.根据权利要求1所述的方法，其特征在于，所述将所述第二识别文本数据发送给所述第二目标用户的智能终端设备的处理还包括：将所述第二识别文本数据和与其相应的语音数据发送给所述第二目标用户的智能终端设备。

3.根据权利要求1所述的方法，其特征在于，所述通过第一线程从智能终端设备接收发送给目标用户的语音数据，将所述语音数据和用于接收所述语音数据的识别结果的回调网页链接封装在HTTP/HTTPS请求中，并且将所述HTTP/HTTPS请求发送给语音识别服务器，包括：通过第一线程根据预先设定的预处理参数对所述语音数据执行预处理，得到预处理后的语音数据，其中，所述预处理参数包括语音格式和语音采样率；

将包括所述预处理后的语音数据和所述回调网页链接的HTTP/HTTPS请求发送给所述语音识别服务器。

4.一种在网络业务中执行语音通信的方法，其特征在于，所述方法包括：

语音识别请求接收步骤：从业务服务器接收语音识别请求，其中，语音数据通过所述业务服务器的第一线程从智能终端设备接收，所述语音识别请求是包括所述语音数据和用于接收所述语音数据的识别结果的回调网页链接的HTTP/HTTPS请求，其中，所述回调网页链接中包括所述目标用户的信息；

语音识别执行步骤：将所述语音数据转换为识别文本数据，其中，如果所述语音数据的语音时长超过预设的时长阈值，则根据预先建立的语音切分模型将所述语音数据切分为多个语音数据段，分别将所述多个语音数据段转换为短识别文本数据，并且将所述短识别文本数据组合成所述识别文本数据；如果所述语音数据的语音时长没有超过所述时长阈值，则直接将所述语音数据识别为所述识别文本数据；

识别文本数据发送步骤：根据所述回调网页链接，将包括所述识别文本数据和所述目标用户的信息的HTTP/HTTPS响应发送给所述回调网页链接对应的业务服务器，以通过所述业务服务器的第二线程将接收到的识别文本数据发送给所述目标用户的智能终端设备。

5.根据权利要求4所述的方法，其特征在于，所述方法还包括：

如果在预定的时间区间内从所述业务服务器接收的语音数据超过预定的数据量，则将所述语音识别请求放置在待识别语音数据队列中，通过单独的线程从所述待识别语音数据队列提取语音识别请求，并且对提取的所述语音识别请求执行所述语音识别执行步骤和识别文本数据发送步骤的处理。

6.根据权利要求5所述的方法，其特征在于，所述通过单独的线程从所述待识别语音数据队列提取语音识别请求的处理还包括：如果提取的语音识别请求在所述待识别语音数据队列中等待被处理的时间长度超过预定的等待时间阈值，则丢弃所述语音识别请求。

7.根据权利要求4所述的方法，其特征在于，所述方法还包括：

根据预先设定的预处理参数对所述语音数据执行预处理，得到预处理后的语音数据，其中，所述预处理参数包括语音格式和语音采样率；

所述语音识别执行步骤的处理包括：

将所述预处理后的语音数据转换为识别文本数据。

8.一种用于在网络业务中执行语音通信的服务器，其特征在于，所述服务器包括：语音数据收发模块，用于通过第一线程从智能终端设备接收发送给目标用户的语音数据，将所述语音数据和用于接收所述语音数据的识别结果的回调网页链接封装在HTTP/HTTPS请求中，并且将所述HTTP/HTTPS请求发送给语音识别服务器，其中，在所述回调网页链接中包括所述目标用户的信息；

用户信息写入模块，用于通过第三线程将通过所述回调网页链接接收到的第一识别文本数据以及所述回调网页链接中包含的第一目标用户的信息写入识别结果队列中；

文本数据发送模块，用于通过第二线程从所述识别结果队列读取第二识别文本数据和相应的第二目标用户的信息，并且将所述第二识别文本数据发送给所述第二目标用户的智能终端设备；

其中，通过线程同步机制控制第三线程对所述识别结果队列的写入操作和第二线程对所述识别结果队列的读取操作。

9.根据权利要求8所述的服务器，其特征在于，所述文本数据发送模块用于：将所述第二识别文本数据和与其相应的语音数据发送给所述第二目标用户的智能终端设备。

10.根据权利要求8所述的服务器，其特征在于，所述语音数据收发模块包括：预处理单元，用于通过第一线程根据预先设定的预处理参数对所述语音数据执行预处理，得到预处理后的语音数据，其中，所述预处理参数包括语音格式和语音采样率；

语音数据发送单元，用于将包括所述预处理后的语音数据和所述回调网页链接的HTTP/HTTPS请求发送给所述语音识别服务器。

11.一种用于在网络业务中执行语音通信的服务器，其特征在于，所述服务器包括：识别请求接收模块，用于从业务服务器接收语音识别请求，所述语音识别请求是包括语音数据和用于接收所述语音数据的识别结果的回调网页链接的HTTP/HTTPS请求，其中，所述回调网页链接中包括所述目标用户的信息；

语音识别执行模块，用于将所述语音数据转换为识别文本数据，其中，所述语音数据通过所述业务服务器的第一线程从智能终端设备接收，其中，如果所述语音数据的语音时长超过预设的时长阈值，则根据预先建立的语音切分模型将所述语音数据切分为多个语音数据段，分别将所述多个语音数据段转换为短识别文本数据，并且将所述短识别文本数据组合成所述识别文本数据；如果所述语音数据的语音时长没有超过所述时长阈值，则直接将所述语音数据识别为所述识别文本数据；

文本数据发送模块，用于根据所述回调网页链接，将包括所述识别文本数据和所述目标用户的信息的HTTP/HTTPS响应发送给所述回调网页链接对应的业务服务器，以通过所述业务服务器的第二线程将接收到的识别文本数据发送给所述目标用户的智能终端设备。

12.根据权利要求11所述的服务器，其特征在于，所述服务器还包括：

识别请求放置模块，用于如果在预定的时间区间内从所述业务服务器接收的语音数据超过预定的数据量，则将所述语音识别请求放置在待识别语音数据队列中，语音识别处理模块，用于通过单独的线程从所述待识别语音数据队列提取语音识别请求，并且对提取的所述语音识别请求执行所述语音识别执行模块和所述文本数据发送模块的处理。

13.根据权利要求12所述的服务器，其特征在于，所述语音识别处理模块用于：如果提取的语音识别请求在所述待识别语音数据队列中等待被处理的时间长度超过预定的等待时间阈值，则丢弃所述语音识别请求。

14.根据权利要求11所述的服务器，其特征在于，所述服务器还包括：

预处理模块，用于根据预先设定的预处理参数对所述语音数据执行预处理，得到预处理后的语音数据，其中，所述预处理参数包括语音格式和语音采样率；

所述语音识别执行模块用于：

将所述预处理后的语音数据转换为识别文本数据。