欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2018103597544
申请人: 百度在线网络技术(北京)有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-02-23
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种视频识别方法,其特征在于,包括:从目标视频中提取目标音频;

从目标音频中提取第一音频特征;

查询索引库中是否存在与第一音频特征匹配的第二音频特征,所述索引库中包括各音频特征与其所属的视频的索引关系;

如果查询到与第一音频特征匹配的第二音频特征,则获取第二音频特征所属的候选视频。

2.根据权利要求1所述的方法,其特征在于,还包括:根据目标视频包括的各音频特征与候选视频包括的各音频特征,比较候选视频与目标视频是否相似。

3.根据权利要求2所述的方法,其特征在于,根据目标视频包括的各音频特征与候选视频包括的各音频特征,比较候选视频与目标视频是否相似,包括:如果候选视频与目标视频的相同音频特征在目标视频的音频特征中所占的比例大于设定阈值,则确定候选视频与目标视频相似。

4.根据权利要求1所述的方法,其特征在于,查询索引库中是否存在与第一音频特征匹配的第二音频特征,包括:向各服务器分发查询请求,所述查询请求中包括第一音频特征,所述查询请求用于指示各所述服务器在自身保存的索引库中查询是否存在与第一音频特征匹配的第二音频特征;

接收各服务器返回的查询结果,所述查询结果中包括与第一音频特征匹配的第二音频特征。

5.根据权利要求1至4中任一项所述的方法,还包括:从各样本视频中提取样本音频;

从各样本音频中提取样本音频特征;

在各服务器的索引库中,分布式地保存各样本视频与各样本音频特征之间的索引关系。

6.一种视频识别装置,其特征在于,包括:第一音频提取模块,用于从目标视频中提取目标音频;

第一特征提取模块,用于从目标音频中提取第一音频特征;

特征查询模块,用于查询索引库中是否存在与第一音频特征匹配的第二音频特征,所述索引库中包括各音频特征与其所属的视频的索引关系;

视频获取模块,用于如果查询到与第一音频特征匹配的第二音频特征,则获取第二音频特征所属的候选视频。

7.根据权利要求6所述的装置,其特征在于,还包括:比较模块,用于根据目标视频包括的各音频特征与候选视频包括的各音频特征,比较候选视频与目标视频是否相似。

8.根据权利要求7所述的装置,其特征在于,所述比较模块还用于如果候选视频与目标视频的相同音频特征在目标视频的音频特征中所占的比例大于设定阈值,则确定候选视频与目标视频相似。

9.根据权利要求6所述的装置,其特征在于,所述特征查询模块包括:请求分发子模块,用于向各服务器分发查询请求,所述查询请求中包括第一音频特征,所述查询请求用于指示各所述服务器在自身保存的索引库中查询是否存在与第一音频特征匹配的第二音频特征;

结果接收子模块,用于接收各服务器返回的查询结果,所述查询结果中包括与第一音频特征匹配的第二音频特征。

10.根据权利要求6至9中任一项所述的装置,还包括:第二音频提取模块,用于从各样本视频中提取样本音频;

第二特征提取模块,用于从各样本音频中提取样本音频特征;

索引库模块,用于在各服务器的索引库中,分布式地保存各样本视频与各样本音频特征之间的索引关系。

11.一种视频识别装置,其特征在于,包括:一个或多个处理器;

存储装置,用于存储一个或多个程序;

当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至5中任一项所述的方法。

12.一种计算机可读存储介质,其存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至5中任一项所述的方法。