知嘟嘟-专利交易平台_专利购买_专利出售-买专利,上嘟嘟

欢迎来到知嘟嘟！联系电话：13095918853 卖家免费入驻，海量在线求购！卖家免费入驻，海量在线求购！

嘟嘟会员

帮助中心网站地图

查出售查高校查求购查年费

我要发布

首页转移热力图Hot 专利交易委托购买高校专区科技服务专利求购年费查询行业资讯

联系电话：13095918853

知嘟嘟经纪人

多媒体文件的情节片段的识别方法及装置

￥23000

专利号： 2014101489975

申请人：百度在线网络技术(北京)有限公司

专利类型：发明专利

专利状态：已下证

专利领域：电通信技术

更新日期：2024-04-18

缴费截止日期：暂无

价格&联系人

年费信息

委托购买

专利简介

专利详情

委托购买说明

需准备材料

常见问题

摘要:

权利要求书:

1.一种多媒体文件的情节片段的识别方法，其特征在于，包括：

获取待处理的多媒体文件，所述多媒体文件包括至少两帧图像；

利用对象跟踪技术，对所述至少两帧图像进行识别处理，以获得目标文件片段；

根据所述多媒体文件的字幕内容和字幕时间，获得目标字幕片段；

根据所述目标文件片段和所述目标字幕片段，确定所述多媒体文件的情节片段；其中，所述根据所述目标文件片段和所述目标字幕片段，确定所述多媒体文件的情节片段，包括：根据所述目标文件片段所对应的第一时间范围，与所述目标字幕片段所对应的第二时间范围，确定所述第一时间范围与所述第二时间范围之间存在交集的目标文件片段和目标字幕片段，将存在交集的每个目标字幕片段所对应的时间范围之内的多媒体文件片段，与该目标字幕片段存在交集的目标文件片段，进行合并，以获得所述至少一个融合文件片段；

根据所述至少一个融合文件片段中相邻的融合文件片段之间的第三时间间隔和预先设置的第三时间阈值，对相邻的融合文件片段进行合并处理，以获得所述多媒体文件的情节片段。

2.根据权利要求1所述的方法，其特征在于，所述利用对象跟踪技术，对所述至少两帧图像进行识别处理，以获得目标文件片段，包括：利用对象跟踪技术，提取所述至少两帧图像中出现目标对象的图像，以获得至少两个候选文件片段；

根据所述至少两个候选文件片段中相邻的候选文件片段之间的第一时间间隔和预先设置的第一时间阈值，对相邻的候选文件片段进行合并处理，以获得所述目标文件片段。

3.根据权利要求1所述的方法，其特征在于，所述根据所述多媒体文件的字幕内容和字幕时间，获得目标字幕片段，包括：根据所述多媒体文件的字幕内容和字幕时间，获得至少两个候选字幕片段；

根据所述至少两个候选字幕片段中相邻的候选字幕片段之间的第二时间间隔和预先设置的第二时间阈值，对相邻的候选字幕片段进行合并处理，以获得所述目标字幕片段。

4.根据权利要求1～3任一权利要求所述的方法，其特征在于，所述根据所述目标文件片段和所述目标字幕片段，确定所述多媒体文件的情节片段，包括：根据所述目标文件片段和所述目标字幕片段，获得至少一个融合文件片段；

5.根据权利要求1～3任一权利要求所述的方法，其特征在于，所述根据所述目标文件片段和所述目标字幕片段，确定所述多媒体文件的情节之后，还包括：根据所述情节片段所对应的时间范围，获得切割字幕内容；

根据所述切割字幕内容，获得每个情节片段的情节内容描述。

6.根据权利要求1～3任一权利要求所述的方法，其特征在于，所述根据所述目标文件片段和所述目标字幕片段，确定所述多媒体文件的情节之后，还包括：根据所述情节片段所对应的时间范围，获得可播放时间，以供根据所述可播放时间，进行所述多媒体文件的播放。

7.一种多媒体文件的情节片段的识别装置，其特征在于，包括：

获取单元，用于获取待处理的多媒体文件，所述多媒体文件包括至少两帧图像；

文件处理单元，用于利用对象跟踪技术，对所述至少两帧图像进行识别处理，以获得目标文件片段；

字幕处理单元，用于根据所述多媒体文件的字幕内容和字幕时间，获得目标字幕片段；

决策单元，用于根据所述目标文件片段和所述目标字幕片段，确定所述多媒体文件的情节片段；其中，所述决策单元，具体用于

根据所述目标文件片段所对应的第一时间范围，与所述目标字幕片段所对应的第二时间范围，确定所述第一时间范围与所述第二时间范围之间存在交集的目标文件片段和目标字幕片段，将存在交集的每个目标字幕片段所对应的时间范围之内的多媒体文件片段，与该目标字幕片段存在交集的目标文件片段，进行合并，以获得所述至少一个融合文件片段；

8.根据权利要求7所述的装置，其特征在于，所述文件处理单元，具体用于利用对象跟踪技术，提取所述至少两帧图像中出现目标对象的图像，以获得至少两个候选文件片段；以及根据所述至少两个候选文件片段中相邻的候选文件片段之间的第一时间间隔和预先设置的第一时间阈值，对相邻的候选文件片段进行合并处理，以获得所述目标文件片段。

9.根据权利要求7所述的装置，其特征在于，所述字幕处理单元，具体用于根据所述多媒体文件的字幕内容和字幕时间，获得至少两个候选字幕片段；以及根据所述至少两个候选字幕片段中相邻的候选字幕片段之间的第二时间间隔和预先设置的第二时间阈值，对相邻的候选字幕片段进行合并处理，以获得所述目标字幕片段。

10.根据权利要求7～9任一权利要求所述的装置，其特征在于，所述决策单元，具体用于根据所述目标文件片段和所述目标字幕片段，获得至少一个融合文件片段；以及根据所述至少一个融合文件片段中相邻的融合文件片段之间的第三时间间隔和预先设置的第三时间阈值，对相邻的融合文件片段进行合并处理，以获得所述多媒体文件的情节片段。

11.根据权利要求7～9任一权利要求所述的装置，其特征在于，所述字幕处理单元，还用于根据所述情节片段所对应的时间范围，获得切割字幕内容；以及

根据所述切割字幕内容，获得每个情节片段的情节内容描述。

12.根据权利要求7～9任一权利要求所述的装置，其特征在于，所述文件处理单元，还用于根据所述情节片段所对应的时间范围，获得可播放时间，以供根据所述可播放时间，进行所述多媒体文件的播放。