欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2024101314404
申请人: 重庆邮电大学
专利类型:发明专利
专利状态:已下证
专利领域: 电通信技术
更新日期:2024-11-19
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种适用于VVC SCC的快速编码模式决策方法,其特征在于,包括:S1:在VTM编码器每帧图像编码开始阶段,将视频帧亮度分量分割成尺寸大小32x32、32x16、32x8、32x4的四组CU;

S2:对四组CU分别设计四种基于卷积神经网络的模式分类器,并设计损失函数对基于卷积神经网络的模式分类器进行训练;

S3:通过训练后的模式分类器并行预测每个子块的编码模式分布,得到每个子块的编码模式概率;

所述编码模式包括:Intra、PLT、IBC;

S4:对每个子块的编码模式概率进行排序,从大到小选择前n个模式的概率并计算前n个模式的概率和s,当所选模式的概率和s大于设定阈值T时,停止选择,得到最优编码模式;

所述阈值T,包括:

利用相邻区域的最佳模式确定阈值T:首先计算相邻区域的权重和相邻区域最佳模式所占的比例,根据相邻区域的权重和相邻区域最佳模式所占的比例计算出当前区域的第i个模式阈值的偏移量,基于当前区域的第i个模式阈值的偏移量得到最终的阈值T;

计算相邻区域的权重和相邻区域最佳模式所占的比例,包括:

区域的权重:

区域最佳模式所占的比例:

其中,Weight

根据相邻区域的权重和相邻区域最佳模式所占的比例计算出当前区域的第i个模式阈值的偏移量,包括:其中,Offset

基于当前区域的第i个模式阈值的偏移量得到最终的阈值T,包括:

其中,T

2.根据权利要求1所述的一种适用于VVC SCC的快速编码模式决策方法,其特征在于,对四组子块分别设计四种基于卷积神经网络的模式分类器,包括:所述四种基于卷积神经网络的模式分类器均包括多层卷积层、一层Flatten层、三层全连接层,其中,多层卷积层对于不同尺寸比率的CU具有不同的结构;不同尺寸的CU通过多层卷积层获取足够数量的特征图,通过Flatten层将特征图展平和完全连接,并通过三层全连接层生成与三种模式Intra、PLT、IBC的概率。

3.根据权利要求2所述的一种适用于VVC SCC的快速编码模式决策方法,其特征在于,多层卷积层对于不同尺寸比率的CU具有不同的结构,包括:尺寸大小32x32的CU的多层卷积层由2层卷积核大小为3x3、步长为1x1的带填充卷积层ConvP和5层卷积核大小和步长均为2x2的下采样卷积层Conv组成;其结构依次为:ConvP1、Conv1、ConvP2、Conv2、Conv3、Conv4、Conv5、Conv6;

尺寸大小32x16的CU的多层卷积层由1层卷积核大小为5x1、步长为1x1的非对称卷积层AsConv和2层卷积核大小为3x1、步长为1x1的非对称卷积层AsConv以及4层卷积核大小和步长均为2x2的下采样卷积层Conv组成;其结构依次为AsConv1、Conv1、AsConv2、Conv2、AsConv3、Conv3、Conv4;

尺寸大小32x8的CU的多层卷积层由2层卷积核大小为5x1、步长为1x1的非对称卷积层AsConv和2层卷积核大小为3x1、步长为1x1的非对称卷积层AsConv以及3层卷积核大小和步长均为2x2的下采样卷积层Conv组成;其结构依次为AsConv1、Conv1、AsConv2、AsConv3、Conv2、AsConv4、Conv3;

尺寸大小32x4的CU的多层卷积层4层卷积核大小为5x1、步长为1x1的非对称卷积层AsConv和2层卷积核大小和步长均为2x2的下采样卷积层Conv组成;其结构依次为AsConv1、Conv1、AsConv2、AsConv3、AsConv4、Conv2。

4.根据权利要求1所述的一种适用于VVC SCC的快速编码模式决策方法,其特征在于,设计损失函数对基于卷积神经网络的模式分类器进行训练,包括:其中,L表示基于卷积神经网络的模式分类器的损失函数,N表示样本数量,M表示每个样本的CM数量,pt表示缩放因子,weight_cost

5.根据权利要求1所述的一种适用于VVC SCC的快速编码模式决策方法,其特征在于,计算前n个模式的概率和s,包括:其中,s表示前n个模式的概率和,pi表示第i个模式的概率。