欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2019101251372
申请人: 浙江工业大学
专利类型:发明专利
专利状态:已下证
专利领域: 电通信技术
更新日期:2023-12-11
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种音频播放和视频抓取的协作方法,其特征在于,所述协作方法包括以下步骤:(1)开始,打开APP,先输入待配音文字,文字经过文字转语音转接口之后,生成配音语音文件;

(2)接着打开摄像头进入取景模式,开始进行语音引导摄录,默认开始是进行触控模式,语音控制模式需要用户手动选择;

(3)播放设定时间“嘀”的提示音,用户准备开始正式录制;

(4)提示音后,开始播放正式配音语音,同时用户正式开启录像模式,摄像头开始抓取视频图像;

(5)先播放第一句配音语音,用户根据语音内容进行摄录;

(6)在上一句语音播放完成后,在该句末尾下句之前插入默音间隔,之后放设定时间提示音;同时录制时顶部显示剩余计时和提示字幕,底部显示当前字幕,摄像头仍在抓取视频图像;

(7)当需要暂停时,提供了两种模式,在默认的触控模式下,用户是手动控制暂停模式,若选择了语音控制模式,则用户是语音控制暂停模式;

(8)在手动控制暂停模式下,用户在当前语句播放的中间某时刻、或者在当前播放结束等待下一语句播放的嘀嘀声播放期间的某一个时刻,用指在屏幕任意一个位置长按,即弹出快捷菜单;

(9)在语音控制暂停模式下,用户想采用语音控制模式来暂停或双暂停,所述暂停是放音暂停,所述双暂停是指放音和录像都暂停,若在扬声器播放的默音间隔內,用户需要发出指定语音指令;

(10)当暂时不需要暂停时,会返回到步骤(6)继续重复往下执行;

(11)当顶端语音播放倒计时到0时,自动停止录音和视频录制,音视频文件自动合成并保存,全流程结束。

2.如权利要求1所述的音频播放和视频抓取的协作方法,其特征在于,所述步骤(8)中,过程如下:

8.1)菜单上有两个菜单条,其中一条“停止放音、录像继续”、另外一条“停止放音、停止录像”;菜单是“一次点中菜单条即消失”的模式,即免退、免关;

8.2)恢复机制,仍长按屏幕任意一处,弹出快捷菜单,对应的菜单条只有一条是“继续”,点击中后菜单即自动消失,同时启动控制放音录像的动作。

3.如权利要求1或2所述的音频播放和视频抓取的协作方法,其特征在于,所述步骤9)中,过程如下:

9.1)若不在默音间隔內,即在扬声器播放谐波声时,用户发出指定语音指令,这时候滤掉谐波声的背景录音即可;

9.2)语音指令识别就是短词识别,所述语音指令包括“放音暂停”、“放音录像暂停”、“恢复”三条短词指令;“放音暂停”、“放音录像暂停”这两条语音指令为了语音控制暂停时使用,最后用户发出“恢复”指令后,会启动控制放音录像的动作。

4.如权利要求1或2所述的音频播放和视频抓取的协作方法,其特征在于,所述步骤(2)中,触控模式的处理过程如下:一句语句播放结束后,在播放下一句之前等待设定时间,而等待的设定时间播放三秒的谐波音;

在播放当前语句时,屏幕顶部显示剩余计时,底部显示当前字幕;顶部除了显示当前语句剩余计时外,还应该显示下一句语句的首部若干个字的字幕作为提示字幕;

用户在当前语句播放的中间某时刻、或者在当前播放结束等待下一语句播放的嘀嘀声播放期间的某一个时刻,用指在屏幕任意一个位置长按,即弹出快捷菜单;

其次,在屏幕画面中通过以下方式来区分暂停状态:整个取景画面外框框上闪烁的虚线示放音暂停、交替闪烁的点虚线和虚线表示摄像和放音双暂停;

最后,APP开启开始工作时默认处于双暂停状态,等待用户触摸控制,这样可能在启动使用时有三步动作,即点击APP启动,在画面上长按,选择击中快捷菜单的继续菜单条,然后正式开始工作。

5.如权利要求1或2所述的音频播放和视频抓取的协作方法,其特征在于,所述步骤(2)中,语音控制模式的处理过程如下:由于麦克风始终处于空闲态,在APP工作期间开启麦克,但录音分析供语音用户接口使用,不用作录像录音;

但麦克风录音时的音频场景可能是扬声器在免提播放语句放音、也可能扬声器处于默音态;

此时麦克风录音的语音识别涉及到双向通话double talk检测问题,在单人模式语音控制下,一定要有扬声器默音间隔才能避开double talk,单人用户控制模式语句间隔大于

3秒;

语音指令识别就是短词识别,包括“放音暂停”、“放音录像暂停”、“恢复”三条短词指令。