1.一种多媒体文件的情节片段的识别方法,其特征在于,包括:
获取待处理的多媒体文件,所述多媒体文件包括至少两帧图像;
利用对象跟踪技术,对所述至少两帧图像进行识别处理,以获得目标文件片段;
根据所述多媒体文件的字幕内容和字幕时间,获得目标字幕片段;
根据所述目标文件片段和所述目标字幕片段,确定所述多媒体文件的情节片段;其中,所述根据所述目标文件片段和所述目标字幕片段,确定所述多媒体文件的情节片段,包括:根据所述目标文件片段所对应的第一时间范围,与所述目标字幕片段所对应的第二时间范围,确定所述第一时间范围与所述第二时间范围之间存在交集的目标文件片段和目标字幕片段,将存在交集的每个目标字幕片段所对应的时间范围之内的多媒体文件片段,与该目标字幕片段存在交集的目标文件片段,进行合并,以获得所述至少一个融合文件片段;
根据所述至少一个融合文件片段中相邻的融合文件片段之间的第三时间间隔和预先设置的第三时间阈值,对相邻的融合文件片段进行合并处理,以获得所述多媒体文件的情节片段。
2.根据权利要求1所述的方法,其特征在于,所述利用对象跟踪技术,对所述至少两帧图像进行识别处理,以获得目标文件片段,包括:利用对象跟踪技术,提取所述至少两帧图像中出现目标对象的图像,以获得至少两个候选文件片段;
根据所述至少两个候选文件片段中相邻的候选文件片段之间的第一时间间隔和预先设置的第一时间阈值,对相邻的候选文件片段进行合并处理,以获得所述目标文件片段。
3.根据权利要求1所述的方法,其特征在于,所述根据所述多媒体文件的字幕内容和字幕时间,获得目标字幕片段,包括:根据所述多媒体文件的字幕内容和字幕时间,获得至少两个候选字幕片段;
根据所述至少两个候选字幕片段中相邻的候选字幕片段之间的第二时间间隔和预先设置的第二时间阈值,对相邻的候选字幕片段进行合并处理,以获得所述目标字幕片段。
4.根据权利要求1~3任一权利要求所述的方法,其特征在于,所述根据所述目标文件片段和所述目标字幕片段,确定所述多媒体文件的情节片段,包括:根据所述目标文件片段和所述目标字幕片段,获得至少一个融合文件片段;
根据所述至少一个融合文件片段中相邻的融合文件片段之间的第三时间间隔和预先设置的第三时间阈值,对相邻的融合文件片段进行合并处理,以获得所述多媒体文件的情节片段。
5.根据权利要求1~3任一权利要求所述的方法,其特征在于,所述根据所述目标文件片段和所述目标字幕片段,确定所述多媒体文件的情节之后,还包括:根据所述情节片段所对应的时间范围,获得切割字幕内容;
根据所述切割字幕内容,获得每个情节片段的情节内容描述。
6.根据权利要求1~3任一权利要求所述的方法,其特征在于,所述根据所述目标文件片段和所述目标字幕片段,确定所述多媒体文件的情节之后,还包括:根据所述情节片段所对应的时间范围,获得可播放时间,以供根据所述可播放时间,进行所述多媒体文件的播放。
7.一种多媒体文件的情节片段的识别装置,其特征在于,包括:
获取单元,用于获取待处理的多媒体文件,所述多媒体文件包括至少两帧图像;
文件处理单元,用于利用对象跟踪技术,对所述至少两帧图像进行识别处理,以获得目标文件片段;
字幕处理单元,用于根据所述多媒体文件的字幕内容和字幕时间,获得目标字幕片段;
决策单元,用于根据所述目标文件片段和所述目标字幕片段,确定所述多媒体文件的情节片段;其中,所述决策单元,具体用于
根据所述目标文件片段所对应的第一时间范围,与所述目标字幕片段所对应的第二时间范围,确定所述第一时间范围与所述第二时间范围之间存在交集的目标文件片段和目标字幕片段,将存在交集的每个目标字幕片段所对应的时间范围之内的多媒体文件片段,与该目标字幕片段存在交集的目标文件片段,进行合并,以获得所述至少一个融合文件片段;
根据所述至少一个融合文件片段中相邻的融合文件片段之间的第三时间间隔和预先设置的第三时间阈值,对相邻的融合文件片段进行合并处理,以获得所述多媒体文件的情节片段。
8.根据权利要求7所述的装置,其特征在于,所述文件处理单元,具体用于利用对象跟踪技术,提取所述至少两帧图像中出现目标对象的图像,以获得至少两个候选文件片段;以及根据所述至少两个候选文件片段中相邻的候选文件片段之间的第一时间间隔和预先设置的第一时间阈值,对相邻的候选文件片段进行合并处理,以获得所述目标文件片段。
9.根据权利要求7所述的装置,其特征在于,所述字幕处理单元,具体用于根据所述多媒体文件的字幕内容和字幕时间,获得至少两个候选字幕片段;以及根据所述至少两个候选字幕片段中相邻的候选字幕片段之间的第二时间间隔和预先设置的第二时间阈值,对相邻的候选字幕片段进行合并处理,以获得所述目标字幕片段。
10.根据权利要求7~9任一权利要求所述的装置,其特征在于,所述决策单元,具体用于根据所述目标文件片段和所述目标字幕片段,获得至少一个融合文件片段;以及根据所述至少一个融合文件片段中相邻的融合文件片段之间的第三时间间隔和预先设置的第三时间阈值,对相邻的融合文件片段进行合并处理,以获得所述多媒体文件的情节片段。
11.根据权利要求7~9任一权利要求所述的装置,其特征在于,所述字幕处理单元,还用于根据所述情节片段所对应的时间范围,获得切割字幕内容;以及
根据所述切割字幕内容,获得每个情节片段的情节内容描述。
12.根据权利要求7~9任一权利要求所述的装置,其特征在于,所述文件处理单元,还用于根据所述情节片段所对应的时间范围,获得可播放时间,以供根据所述可播放时间,进行所述多媒体文件的播放。