欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2020101667319
申请人: 重庆邮电大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-11-28
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于Wasserstein距离的图像快速增强方法,其特征在于:包括以下步骤:S1:利用已有公开的盲去模糊的数据集构建模糊到清晰且色彩饱满的多任务数据集;

S2:将构建的数据集输入到构建的深度学习模型中,对模型进行训练;

S3:将待处理的运动模糊图像输入到训练完成的深度学习模型中得到清晰且色彩饱满的图像。

2.根据权利要求1所述的基于Wasserstein距离的图像快速增强方法,其特征在于:步骤S1具体包括:将公开数据集GoPRO的清晰图像输入到公开的图像色彩增强模型中得到清晰且色彩饱满的目标图像。

3.根据权利要求1所述的基于Wasserstein距离的图像快速增强方法,其特征在于:步骤S2中深度学习模型的训练步骤包括:S21:将运动模糊图像输入到图像重建网络,图像重建网络中的下采样模块提取运动模糊图像的特征,下采样的处理过程表示为:Enc()=3ResBe()

ResBe()=2Conv()+Conv(2Conv())

其中 表示输入图像具有3个通道且尺寸为h×w,Enc()代表下采样编码操作,ResBe()代表下采样残差块操作,Conv()代表卷积操作;

S22:将下采样模块得到的特征输入到上采样模块中得到恢复图像:featureconc=Concatenate(featuree,featured)Dec()=3ResBd()

ResBd()=DConv(Conv(Conv(X)+X))其中 为恢复图像,Dec()为上采样解码操作,ResBd()代表上采样残差块,Concatenate()代表拼接操作,DConv()代表反卷积操作;

S23:将恢复图像与目标图像输入到L1损失计算模块中计算恢复图像和目标图像之间的L1像素损失,L1像素损失的计算由如下公式表示:其中w,h,c分别代表图像的宽度、高度和通道数;

S24:将恢复图像和目标图像再输入到带有参数剪枝操作的图像得分网络中计算Wasserstein距离,所述图像得分网络包括5层卷积层和2层全连接层,每层卷积层得到的特征个数为其输入特征的两倍且特征尺寸为输入的一半,2层全连接层将得到的特征处理为数据分布得分,图像得分网络的过程表示为:Disc()=5Conv()

score=FC2(line1024)

其中Disc()表示图像得分网络的卷积操作,FC()表示全连接操作,line1024表示第一个全连接层操作得到的尺寸为1024的一维向量,score为最后的数据分布得分;

S25:将恢复图像的数据分布得分和目标图像的数据分布得分进行差值运算后得到它们之间的Wasserstein距离:Dloss=scoreG-scoreT

其中scoreG,scoreT分别代表恢复图像的数据分布得分和目标图像的数据分布得分,图像得分网络以降低此距离为目标不断优化参数;

S26:将恢复图像的数据分布得分取反后加入到其与目标图像的像素损失中得到图像重建网络的优化目标:Gloss=-scoreG+L1(G,X)

当Gloss收敛到稳定状态时,则停止训练,最后得到的图像重建网络参数便是图像重建网络恢复清晰且色彩饱满图像的关键。

4.根据权利要求3所述的基于Wasserstein距离的图像快速增强方法,其特征在于:步骤S21中,所述运动模糊图像的特征共256个,包括纹理特征、色彩特征、边缘特征。

5.根据权利要求3所述的基于Wasserstein距离的图像快速增强方法,其特征在于:所述下采样模块下包括9层卷积层,每3层为一个残差块,即前两层的卷积结果与第三层的卷积结果进行残差连接,每个残差块提取的特征个数是其前一个残差块提取的两倍且特征尺度减半。

6.根据权利要求3所述的基于Wasserstein距离的图像快速增强方法,其特征在于:所述上采样模块与下采样模块具有对称结构,拥有6层卷积层和3层为反卷积层,每个残差块得到恢复特征个数为前一个残差块恢复的一半且尺寸翻倍,上采样模块中设置有跳跃连接操作,即第一个和第二个残差块的输出与对应的下采样模块中的残差块的输出进行拼接操作。

7.根据权利要求1所述的基于Wasserstein距离的图像快速增强方法,其特征在于:步骤S3中,将待处理图像解析为适应模型处理的数据,然后将该数据输入到构建的模型中并加载训练得到的图像重建网络参数,当得到图像重建网络恢复的数据后,再将该恢复数据编码成具体格式的图像。

8.根据权利要求1所述的基于Wasserstein距离的图像快速增强方法,其特征在于:步骤S3具体包括如下步骤:S31:将待处理的单张运动模糊图像处理为适应于模型的数据,即,将输入图像解码为相应的灰度级为256级的3维整型张量,然后再将该张量进行归一化处理为3维浮点张量,最后提升该张量的维度为4维:S32:将经过处理后得到的张量输入到训练完成的模型的图像重建网络中得到恢复张量:S33:将得到的恢复张量编码成具体的图像格式便得到了处理后的图像:其中,Clip()代表将张量的值剪枝到特定范围,此处为剪枝到(0,255.0),SqueezeDim()代表降低张量维度操作,Img代表恢复的清晰且色彩饱满的图像。