1.一种基于贝叶斯决策的HEVC块划分快速方法,其特征在于将CU划分操作看作二分类问题,即W={ωN,ωP},其中ωN表示当前CU不继续划分,ωp表示当前CU继续划分,并采用最小风险贝叶斯决策来解决二分类问题,具体实现步骤如下:步骤1、离线学习得到损失函数CNP和CPN以及先验概率P(ωN)和P(ωP);
步骤2、对于传入的图片序列,判断其是否处于在线学习阶段或者场景是否发生了变化,若当前帧处于在线学习阶段或者是场景变换帧,根据HM标准算法对其进行深度划分,提取并存储每个深度的特征值,跳转到步骤7;否则执行步骤3;
步骤3、判断图片是否为快速划分阶段的第一帧图像,若不是,执行步骤4;否则提取在线学习阶段或场景变换帧存储的特征值,并基于特征值建立混合高斯模型,模型的统计参数用以K-Means算法初始化的EM算法来估计;
步骤4、提取当前CU的特征值,求得p(X|ωR)R∈{N,P};
提取待划分的CU的特征值X,根据所处深度求得在同深度的混合高斯分布上的函数值,即p(X|ωN)和p(X|ωP);
步骤5、决定是否划分当前CU,若划分,对每一个Sub-CU执行步骤1-步骤4所述过程;否则不划分当前CU,跳到步骤6;
针对当前CU划分的判断如下:计算比较 和 大小,若 较大,将当前CU划分为四个Sub-CU,并对每一个Sub-CU执行步骤1-5;
步骤6、对该CU进行编码,若当前帧图像CU已经划分完成,执行步骤7;否则,对下一个CU执行步骤1-6所述过程;
步骤7、跳转到步骤2对下一视频帧进行处理,直至编码完所有的视频帧;
步骤1具体过程如下:
提出将错误决策带来的率失真性能的下降作为贝叶斯风险函数,建立基于最小风险的贝叶斯决策模型,以降低错误决策带来的率失真性能损失,完全率失真代价函数如下式所示:JFRD=(SSEluma+ωchroma×SSEchroma)+λmode×Bmode其中,SSEluma,表示亮度的原始图像块和重建图像块之间的像素差误差平方和;SSEchroma表示色度信号的原始图像块和重建图像块之间的像素差误差平方和,ωchroma为色度分量的权重系数,λmode是拉格朗日乘数,Bmode是对当前编码模式时所需要的比特数;
对于64×64,32×32,16×16大小的CU,分别通过离线学习训练得到损失矩阵C,损失矩阵定义如下式所示:此处CPN和CNP定义如下:
JFRD,N和JFRD,P分别是当前待划分CU不继续划分和继续划分成四个子块对应的完全率失真代价;CNP表示假设ωN为真,即率失真结果为“不划分”时判断假设ωP成立,即对CU采取“划分”决策时所带来的风险代价;CPN表示假设ωP为真,对CU采取“不划分”决策时所带来的风险代价;CNP和CPN大于等于0,当决策是正确的时候(CNN或CPP),决策的损失值为0;
先验概率P(ωR)是通过统计当前深度下,作出ωR决策的CU占所有CU的比重得到的,即P(ωR)=当前深度属于ωR的CU数/当前深度CU总数;
其中R为N或者P;
步骤2具体实现如下:
用平均灰度差值来衡量视频运动的剧烈程度,即是否发生场景变换,视频序列中相邻两帧在相同位置上的像素点的平均灰度差值计算如下式所示:式中,P、Q为图像宽度和高度,Gn(i,j)为第n帧像素点(i,j)处的灰度值,Gn-1(i,j)为第n-1帧像素点(i,j)处的灰度值;若没有场景切换,G通常比较小;若发生场景变换,G通常急剧增大;
若G大于检测阈值,则认为场景发生变换,否则,认为场景没有变化,即λsc为检测阈值,其值常为经验值,用于判断是否发生场景变换;检测阈值设为9,即当G>
9时认为发生场景变换,否则没有发生场景变换;
步骤3具体的实现过程如下:
设每个CU的观测信息用n维特征向量X=[x1,x2,x3…xn]来描述,p(X|ωR),R∈{N,P},是ωR状态下观察特征向量X的条件概率密度;状态ωR的后验概率p(ωR|X)可以由贝叶斯公式求得引入损失函数CRQ,表示率失真优化结果为决策R,错误地归类为决策Q情况下的风险;考虑风险的情况下的贝叶斯规则变为:RN(ωN|X)=CNNp(X|ωN)P(ωN)+CPNp(X|ωP)P(ωP)RP(ωP|X)=CPPp(X|ωP)P(ωP)+CNPp(X|ωN)P(ωN)RR(X)为条件风险,表示了特征值X被判为ωR类时损失的均值,CNP表示假设ωN为真,即率失真结果为“不划分”时判断假设ωP成立,即对CU采取“划分”决策时所带来的风险代价;
为了保证期望风险最小,须保证做每一个决策时,都使得条件风险最小,这样的决策被称为最小风险贝叶斯决策,决策的规则如下:若RN(ωN|X)
3-1.特征提取和选择
从观测值中提取特征向量Jinter和Jintra,由下式获得:JLRD=SAD+λpred×Bpred
Jinter=argminP∈Inter{JLRD(P)}Jintra=argminP∈Intra{JLRD(P)}此处λpred是拉格朗日乘数,Bpred对当前预测模式下所有信息;进行编码时所需要的比特数,P表示PU的候选划分;
特征向量X从在线学习阶段的图片中获得,如果训练图片是I帧,特征向量的维度就降到1,X=Jintra,因为I帧的只能采用帧内预测模式;
3-2.在线学习的概率密度分布函数
根据RN(ωN|X)和RP(ωP|X)的值来确定是否划分当前待划分CU;由最小风险贝叶斯公式可知,要比较RR(ωR|X)的大小,需要先求得p(X|ωN)P(ωN)和p(X|ωP)P(ωP)的值;
每个划分深度的“划分”或者“不划分”情况下,似然函数都服从二维高斯随机分布,即p(X|ωR)由两个独立概率的高斯概率密度函数加权和近似表示,因此有:其中i为混合高斯模型中第i个单高斯模型;每个高斯模型的参数为θi=(μi,σi),μi和σi表示类ωi的特征向量的均值向量和方差,特征向量X的混合概率函数为其中Θ=(θ1,θ2)是混合高斯模型的分布参数集,P=(p(ω1),p(ω2))是对应的高斯模型的先验概率集;混合高斯模型的参数由以K-Means算法初始化的EM算法确定。