欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 201710826355X
申请人: 浙江科技学院
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-02-23
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种立体图像视觉显著提取方法,其特征在于包括以下步骤:

①对于任意一幅测试立体图像Stest,将Stest的左视点图像记为{LRGB(x,y)},将Stest的左视差图像记为{D(x,y)};其中,1≤x≤W,1≤y≤H,W表示Stest的宽度,H表示Stest的高度,LRGB(x,y)表示{LRGB(x,y)}中坐标位置为(x,y)的像素点的像素值,D(x,y)表示{D(x,y)}中坐标位置为(x,y)的像素点的像素值;

②将{LRGB(x,y)}从RGB颜色空间转换到Lab颜色空间,并将数据类型转换到实数类型,得到Lab颜色空间的左视点图像,记为{LLab(x,y)};然后将{LLab(x,y)}的L通道图像记为{LLab,L(x,y)},将{LLab(x,y)}的a通道图像记为{LLab,a(x,y)},将{LLab(x,y)}的b通道图像记为{LLab,b(x,y)};再将{LLab,L(x,y)}、{LLab,a(x,y)}和{LLab,b(x,y)}均缩放到200×200像素尺寸,将{LLab,L(x,y)}、{LLab,a(x,y)}和{LLab,b(x,y)}缩放后得到的图像对应记为{L200,L(x1,y1)}、{L200,a(x1,y1)}和{L200,b(x1,y1)};其中,LLab(x,y)表示{LLab(x,y)}中坐标位置为(x,y)的像素点的像素值,LLab,L(x,y)表示{LLab,L(x,y)}中坐标位置为(x,y)的像素点的像素值,LLab,a(x,y)表示{LLab,a(x,y)}中坐标位置为(x,y)的像素点的像素值,LLab,b(x,y)表示{LLab,b(x,y)}中坐标位置为(x,y)的像素点的像素值,1≤x1≤200,1≤y1≤200,L200,L(x1,y1)表示{L200,L(x1,y1)}中坐标位置为(x1,y1)的像素点的像素值,L200,a(x1,y1)表示{L200,a(x1,y1)}中坐标位置为(x1,y1)的像素点的像素值,L200,b(x1,y1)表示{L200,b(x1,y1)}中坐标位置为(x1,y1)的像素点的像素值;

对{D(x,y)}进行归一化处理,将归一化处理后得到的图像记为{D0,1(x,y)};然后将{D0,1(x,y)}缩放到200×200像素尺寸,将缩放后得到的图像记为{D200(x1,y1)};其中,D0,1(x,y)∈[0,1],D0,1(x,y)表示{D0,1(x,y)}中坐标位置为(x,y)的像素点的像素值,D200(x1,y1)表示{D200(x1,y1)}中坐标位置为(x1,y1)的像素点的像素值;

③对{D200(x1,y1)}进行梯度提取,得到{D200(x1,y1)}的梯度幅值图,记为{G200,D(x1,y1)};同样,对{L200,L(x1,y1)}进行梯度提取,得到{L200,L(x1,y1)}的梯度幅值图,记为{G200,L(x1,y1)};对{L200,a(x1,y1)}进行梯度提取,得到{L200,a(x1,y1)}的梯度幅值图,记为{G200,a(x1,y1)};对{L200,b(x1,y1)}进行梯度提取,得到{L200,b(x1,y1)}的梯度幅值图,记为{G200,b(x1,y1)};其中,G200,D(x1,y1)表示{G200,D(x1,y1)}中坐标位置为(x1,y1)的像素点的像素值,G200,L(x1,y1)表示{G200,L(x1,y1)}中坐标位置为(x1,y1)的像素点的像素值,G200,a(x1,y1)表示{G200,a(x1,y1)}中坐标位置为(x1,y1)的像素点的像素值,G200,b(x1,y1)表示{G200,b(x1,y1)}中坐标位置为(x1,y1)的像素点的像素值;

④对{G200,D(x1,y1)}中的每个像素点的像素值进行对数计算,将对数计算后得到的图像记为{GQ200,D(x1,y1)},将{GQ200,D(x1,y1)}中坐标位置为(x1,y1)的像素点的像素值记为GQ200,D(x1,y1),GQ200,D(x1,y1)=log10(1+2000×G200,D(x1,y1));同样,对{G200,L(x1,y1)}中的每个像素点的像素值进行对数计算,将对数计算后得到的图像记为{GQ200,L(x1,y1)},将{GQ200,L(x1,y1)}中坐标位置为(x1,y1)的像素点的像素值记为GQ200,L(x1,y1),GQ200,L(x1,y1)=log10(1+

100×G200,L(x1,y1));对{G200,a(x1,y1)}中的每个像素点的像素值进行对数计算,将对数计算后得到的图像记为{GQ200,a(x1,y1)},将{GQ200,a(x1,y1)}中坐标位置为(x1,y1)的像素点的像素值记为GQ200,a(x1,y1),GQ200,a(x1,y1)=log10(1+100×G200,a(x1,y1));对{G200,b(x1,y1)}中的每个像素点的像素值进行对数计算,将对数计算后得到的图像记为{GQ200,b(x1,y1)},将{GQ200,b(x1,y1)}中坐标位置为(x1,y1)的像素点的像素值记为GQ200,b(x1,y1),GQ200,b(x1,y1)=log10(1+100×G200,b(x1,y1));

⑤利用200×200像素尺寸的中心偏好图{Csaliency200(x1,y1)}对{GQ200,D(x1,y1)}进行中心四周加强,将中心四周加强后得到的图像记为{GQ200CS,D(x1,y1)},将{GQ200CS,D(x1,y1)}中坐标位置为(x1,y1)的像素点的像素值记为DQ200CS,D(x1,y1),GQ200CS,D(x1,y1)=GQ200,D(x1,y1)×Csaliency200(x1,y1)×0.5;同样,利用200×200像素尺寸的中心偏好图{Csaliency200(x1,y1)}对{GQ200,L(x1,y1)}进行中心四周加强,将中心四周加强后得到的图像记为{GQ200CS,L(x1,y1)},将{GQ200CS,L(x1,y1)}中坐标位置为(x1,y1)的像素点的像素值记为GQ200CS,L(x1,y1),GQ200CS,L(x1,y1)=GQ200,L(x1,y1)×Csaliency200(x1,y1);利用200×200像素尺寸的中心偏好图{Csaliency200(x1,y1)}对{GQ200,a(x1,y1)}进行中心四周加强,将中心四周加强后得到的图像记为{GQ200CS,a(x1,y1)},将{GQ200CS,a(x1,y1)}中坐标位置为(x1,y1)的像素点的像素值记为GQ200CS,a(x1,y1),GQ200CS,a(x1,y1)=GQ200,a(x1,y1)×Csaliency200(x1,y1);利用200×200像素尺寸的中心偏好图{Csaliency200(x1,y1)}对{GQ200,b(x1,y1)}进行中心四周加强,将中心四周加强后得到的图像记为{GQ200CS,b(x1,y1)},将{GQ200CS,b(x1,y1)}中坐标位置为(x1,y1)的像素点的像素值记为GQ200CS,b(x1,y1),GQ200CS,b(x1,y1)=GQ200,b(x1,y1)×Csaliency200(x1,y1);其中,Csaliency200(x1,y1)表示{Csaliency200(x1,y1)}中坐标位置为(x1,y1)的像素点的像素值;

⑥将{GQ200CS,D(x1,y1)}的矩阵表示形式、{GQ200CS,L(x1,y1)}的矩阵表示形式、{GQ200CS,a(x1,y1)}的矩阵表示形式、{GQ200CS,b(x1,y1)}的矩阵表示形式组成四元数矩阵,记为{QI200(x1,y1)},将{QI200(x1,y1)}中坐标为(x1,y1)的元素的四元数值记为QI200(x1,y1),QI200(x1,y1)=GQ200CS,D(x1,y1)+i×GQ200CS,L(x1,y1)+j×GQ200CS,a(x1,y1)+k×GQ200CS,b(x1,y1);然后对{QI200(x1,y1)}实施四元数傅里叶变换,得到{QI200(x1,y1)}的频域矩阵,记为{Qf200(u1,v1)};

其中,i、j、k均为虚数单位,GQ200CS,D(x1,y1)为QI200(x1,y1)的实部,GQ200CS,L(x1,y1)为QI200(x1,y1)的i虚部,GQ200CS,a(x1,y1)为QI200(x1,y1)的j虚部,GQ200CS,b(x1,y1)为QI200(x1,y1)的k虚部,1≤u1≤200,1≤v1≤200,Qf200(u1,v1)表示{Qf200(u1,v1)}中坐标为(u1,v1)的元素的四元数值;

⑦利用200×200像素尺寸的频域滤波模板图{LG200(u1,v1)}对{Qf200(u1,v1)}进行Log-Gabor低通滤波,得到{Qf200(u1,v1)}对应的低通特征图,记为{Qlog-Gabor200(u1,v1)};然后对{Qlog-Gabor200(u1,v1)}的矩阵表示形式实施四元数傅里叶反变换,将四元数傅里叶反变换后得到的四元数矩阵记为{Qo200(x1,y1)},将{Qo200(x1,y1)}中坐标为(x1,y1)的元素的四元数值记为Qo200(x1,y1),Qo200(x1,y1)=u200(x1,y1)+i×u200i(x1,y1)+j×u200j(x1,y1)+k×u200k(x1,y1);其中,LG200(u1,v1)表示{LG200(u1,v1)}中坐标位置为(u1,v1)的像素点的像素值,Qlog-Gabor200(u1,v1)表示{Qlog-Gabor200(u1,v1)}中坐标位置为(u1,v1)的像素点的像素值,u200(x1,y1)表示{Qo200(x1,y1)}的实数矩阵{u200(x1,y1)}中坐标为(x1,y1)的元素的值,u200i(x1,y1)表示{Qo200(x1,y1)}的虚数i矩阵{u200i(x1,y1)}中坐标为(x1,y1)的元素的值,u200j(x1,y1)表示{Qo200(x1,y1)}的虚数j矩阵{u200j(x1,y1)}中坐标为(x1,y1)的元素的值,u200k(x1,y1)表示{Qo200(x1,y1)}的虚数k矩阵{u200k(x1,y1)}中坐标为(x1,y1)的元素的值;

⑧根据{u200(x1,y1)},{u200i(x1,y1)},{u200j(x1,y1)}和{u200k(x1,y1)},获取Stest的初步视觉显著图,记为{SQFT-LG200(x1,y1)},将{SQFT-LG200(x1,y1)}中坐标位置为(x1,y1)的像素点的像素值记为SQFT-LG200(x1,y1),SQFT-LG200(x1,y1)=0.3×u200(x1,y1)+u200i(x1,y1)+u200j(x1,y1)+u200k(x1,y1);然后对{SQFT-LG200(x1,y1)}进行归一化处理,将归一化处理后得到的图像记为{SQFT-F(x1,y1)};再将{SQFT-F(x1,y1)}缩放到W×H像素尺寸,将缩放后得到的图像作为Stest的最终视觉显著图,记为{SF(x,y)};其中,SQFT-F(x1,y1)表示{SQFT-F(x1,y1)}中坐标位置为(x1,y1)的像素点的像素值,SF(x,y)表示{SF(x,y)}中坐标位置为(x,y)的像素点的像素值。

2.根据权利要求1所述的一种立体图像视觉显著提取方法,其特征在于所述的步骤②中, 其

中,min()为取最小值函数,max()为取最大值函数。

3.根据权利要求1所述的一种立体图像视觉显著提取方法,其特征在于所述的步骤③中,G200,D(x1,y1)=abs(G200x,D(x1,y1)+G200y,D(x1,y1)),G200,L(x1,y1)=abs(G200x,L(x1,y1)+G200y,L(x1,y1)),G200,a(x1,y1)=abs(G200x,a(x1,y1)+G200y,a(x1,y1)),G200,b(x1,y1)=abs(G200x,b(x1,y1)+G200y,b(x1,y1));其中,abs()表示取绝对值函数,G200x,D(x1,y1)表示对{D200(x1,y1)}的水平方向进行梯度提取得到的水平方向梯度图{G200x,D(x1,y1)}中坐标位置为(x1,y1)的像素点的像素值,G200y,D(x1,y1)表示对{D200(x1,y1)}的垂直方向进行梯度提取得到的垂直方向梯度图{G200y,D(x1,y1)}中坐标位置为(x1,y1)的像素点的像素值,G200x,L(x1,y1)表示对{L200,L(x1,y1)}的水平方向进行梯度提取得到的水平方向梯度图{G200x,L(x1,y1)}中坐标位置为(x1,y1)的像素点的像素值,G200y,L(x1,y1)表示对{L200,L(x1,y1)}的垂直方向进行梯度提取得到的垂直方向梯度图{G200y,L(x1,y1)}中坐标位置为(x1,y1)的像素点的像素值,G200x,a(x1,y1)表示对{L200,a(x1,y1)}的水平方向进行梯度提取得到的水平方向梯度图{G200x,a(x1,y1)}中坐标位置为(x1,y1)的像素点的像素值,G200y,a(x1,y1)表示对{L200,a(x1,y1)}的垂直方向进行梯度提取得到的垂直方向梯度图{G200y,a(x1,y1)}中坐标位置为(x1,y1)的像素点的像素值,G200x,b(x1,y1)表示对{L200,b(x1,y1)}的水平方向进行梯度提取得到的水平方向梯度图{G200x,b(x1,y1)}中坐标位置为(x1,y1)的像素点的像素值,G200y,b(x1,y1)表示对{L200,b(x1,y1)}的垂直方向进行梯度提取得到的垂直方向梯度图{G200y,b(x1,y1)}中坐标位置为(x1,y1)的像素点的像素值。

4.根据权利要求1所述的一种立体图像视觉显著提取方法,其特征在于所述的步骤⑤中, 其中,e为自然基数,x0表示{Csaliency200(x1,y1)}的

中心像素点的横坐标,y0表示{Csaliency200(x1,y1)}的中心像素点的纵坐标,δD表示中心偏好参数。

5.根据权利要求1所述的一种立体图像视觉显著提取方法,其特征在于所述的步骤⑦中,{LG200(u1,v1)}利用Log-Gabor频域滤波器生成,生成{LG200(u1,v1)}的过程中所需的4个输入参数的取值分别为:带宽控制参数σF的取值为0.3,滤波模板图宽度控制参数u0的取值为100,滤波模板图高度控制参数v0的取值为100,滤波器中心频率控制参数ω0的取值为

0.1667;所述的步骤⑦中,Qlog-Gabor200(u1,v1)=LG200(u1,v1)×Qf200(u1,v1)。

6.根据权利要求1所述的一种立体图像视觉显著提取方法,其特征在于所述的步骤⑧中, 其中,max()表示取最大

值函数。