欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2018112765591
申请人: 浙江科技学院
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-02-23
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于深度可分卷积神经网络的视觉深度估计方法,其特征在于包括训练阶段和测试阶段两个过程;

所述的训练阶段过程的具体步骤为:

步骤1_1:选取N幅原始的单目图像及每幅原始的单目图像对应的真实深度图像,并构成训练集,将训练集中的第n幅原始的单目图像记为{Qn(x,y)},将训练集中与{Qn(x,y)}对应的真实深度图像记为 其中,N为正整数,N≥1000,n为正整数,1≤n≤N,1≤x≤R,1≤y≤L,R表示{Qn(x,y)}和 的宽度,L表示{Qn(x,y)}和 的高

度,R和L均能被2整除,Qn(x,y)表示{Qn(x,y)}中坐标位置为(x,y)的像素点的像素值,表示 中坐标位置为(x,y)的像素点的像素值;

步骤1_2:构建深度可分卷积神经网络:深度可分卷积神经网络包括输入层、隐层和输出层;隐层包括5个卷积层、11个批规范化层、9个激活层、3个最大池化层、2个conv_block网络块、4个深度可分卷积网络块、1个Concatanate融合层、3个Add融合层、3个反卷积层、3个可分离卷积层;深度可分卷积网络块由1个卷积层、4个批规范化层、2个可分离卷积层、3个激活层、1个带孔可分离卷积层、1个Add融合层组成,深度可分卷积网络块中的卷积层和第1个批规范化层依次设置构成第一输入块,深度可分卷积网络块中的第1个可分离卷积层、第

2个批规范化层、第1个激活层、带孔可分离卷积层、第3个批规范化层、第2个激活层、第2个可分离卷积层、第4个批规范化层依次设置构成第二输入块;

对于输入层,输入层的输入端接收一幅原始输入图像,输入层的输出端输出原始输入图像给隐层;其中,要求输入层的输入端接收的原始输入图像的宽度为R、高度为L;

对于隐层,5个卷积层的卷积核大小均为3×3、卷积步长均采用默认值,第1个卷积层的卷积核个数为16,第2个卷积层的卷积核个数为32,第3个卷积层的卷积核个数为64,第4个卷积层的卷积核个数为1024,第5个卷积层的卷积核个数为1,11个批规范化层的参数均采用默认值,9个激活层的激活函数均采用ReLu,3个最大池化层的池化步长均为2×2,2个conv_block网络块各自中的所有卷积层和带孔卷积层的卷积核大小均为3×3、卷积步长均采用默认值,第1个conv_block网络块中的所有卷积层和带孔卷积层的卷积核个数为128,第2个conv_block网络块中的所有卷积层和带孔卷积层的卷积核个数为256,2个conv_block网络块各自中的所有批规范化层的参数均采用默认值,2个conv_block网络块各自中的所有激活层的激活函数均采用ReLu,第1个conv_block网络块中的1个带孔卷积层为一卷积层通过设置扩张比为1×1形成,第2个conv_block网络块中的1个带孔卷积层为一卷积层通过设置扩张比为2×2形成,4个深度可分卷积网络块中的卷积层、可分离卷积层、带孔可分离卷积层的卷积核大小均为3×3、卷积步长均采用默认值,第1个和第2个深度可分卷积网络块中的卷积层、可分离卷积层、带孔可分离卷积层的卷积核个数为128,第3个深度可分卷积网络块中的卷积层、可分离卷积层、带孔可分离卷积层的卷积核个数为256,第4个深度可分卷积网络块中的卷积层、可分离卷积层、带孔可分离卷积层的卷积核个数为512,第1个深度可分卷积网络块中的带孔可分离卷积层为一可分离卷积层通过设置扩张比为1×1形成,第2个深度可分卷积网络块中的带孔可分离卷积层为一可分离卷积层通过设置扩张比为1×1形成,第3个深度可分卷积网络块中的带孔可分离卷积层为一可分离卷积层通过设置扩张比为2×2形成,第4个深度可分卷积网络块中的带孔可分离卷积层为一可分离卷积层通过设置扩张比为4×4形成,4个深度可分卷积网络块中的批规范化层的参数均采用默认值,4个深度可分卷积网络块中的激活层的激活函数均采用ReLu,3个反卷积层的卷积核大小均为3×3、卷积步长均为2×2,第1个反卷积层的卷积核个数为64,第2个反卷积层的卷积核个数为32,第3个反卷积层的卷积核个数为16,3个可分离卷积层的卷积核大小均为3×

3、卷积步长均采用默认值,第1个可分离卷积层的卷积核个数为64,第2个可分离卷积层的卷积核个数为32,第3个可分离卷积层的卷积核个数为16;

对于隐层,第1个卷积层的输入端接收输入层的输出端输出的原始输入图像,第1个卷积层的输出端输出16幅特征图,将输出的所有特征图构成的集合记为J1,其中,J1中的每幅特征图的宽度为R、高度为L;第1个批规范化层的输入端接收J1中的所有特征图,第1个批规范化层的输出端输出16幅特征图,将输出的所有特征图构成的集合记为P1,其中,P1中的每幅特征图的宽度为R、高度为L;第1个激活层的输入端接收P1中的所有特征图,第1个激活层的输出端输出16幅特征图,将输出的所有特征图构成的集合记为H1,其中,H1中的每幅特征图的宽度为R、高度为L;第1个最大池化层的输入端接收H1中的所有特征图,第1个最大池化层的输出端输出16幅特征图,将输出的所有特征图构成的集合记为Z1,其中,Z1中的每幅特征图的宽度为 高度为 第2个卷积层的输入端接收Z1中的所有特征图,第2个卷积层的输出端输出32幅特征图,将输出的所有特征图构成的集合记为J2,其中,J2中的每幅特征图的宽度为 高度为 第2个批规范化层的输入端接收J2中的所有特征图,第2个批规范化层的输出端输出32幅特征图,将输出的所有特征图构成的集合记为P2,其中,P2中的每幅特征图的宽度为 高度为 第2个激活层的输入端接收P2中的所有特征图,第2个激活层的输出端输出32幅特征图,将输出的所有特征图构成的集合记为H2,其中,H2中的每幅特征图的宽度为 高度为 第2个最大池化层的输入端接收H2中的所有特征图,第2个最大池化层的输出端输出32幅特征图,将输出的所有特征图构成的集合记为Z2,其中,Z2中的每幅特征图的宽度为 高度为 第3个卷积层的输入端接收Z2中的所有特征图,第3个卷积层的输出端输出64幅特征图,将输出的所有特征图构成的集合记为J3,其中,J3中的每幅特征图的宽度为 高度为 第3个批规范化层的输入端接收J3中的所有特征图,第3个批规范化层的输出端输出64幅特征图,将输出的所有特征图构成的集合记为P3,其中,P3中的每幅特征图的宽度为 高度为 第3个激活层的输入端接收P3中的所有特征图,第3个激活层的输出端输出64幅特征图,将输出的所有特征图构成的集合记为H3,其中,H3中的每幅特征图的宽度为 高度为 第3个最大池化层的输入端接收H3中的所有特征图,第3个最大池化层的输出端输出64幅特征图,将输出的所有特征图构成的集合记为Z3,其中,Z3中的每幅特征图的宽度为 高度为 第1个conv_block网络块的输入端接收Z3中的所有特征图,第1个conv_block网络块的输出端输出128幅特征图,将输出的所有特征图构成的集合记为B1,其中,B1中的每幅特征图的宽度为 高度为 第1个深度可分卷积网络块的输入端接收B1中的所有特征图,第1个深度可分卷积网络块的输出端输出128幅特征图,将输出的所有特征图构成的集合记为S1,其中,S1中的每幅特征图的宽度为 高度为 第2个深度可分卷积网络块的输入端接收S1中的所有特征图,第2个深度可分卷积网络块的输出端输出128幅特征图,将输出的所有特征图构成的集合记为S2,其中,S2中的每幅特征图的宽度为高度为 第2个conv_block网络块的输入端接收S2中的所有特征图,第2个conv_block网络块的输出端输出256幅特征图,将输出的所有特征图构成的集合记为B2,其中,B2中的每幅特征图的宽度为 高度为 第3个深度可分卷积网络块的输入端接收B2中的所有特征图,第3个深度可分卷积网络块的输出端输出256幅特征图,将输出的所有特征图构成的集合记为S3,其中,S3中的每幅特征图的宽度为 高度为 第4个深度可分卷积网络块的输入端接收S3中的所有特征图,第4个深度可分卷积网络块的输出端输出512幅特征图,将输出的所有特征图构成的集合记为S4,其中,S4中的每幅特征图的宽度为 高度为Concatanate融合层的输入端接收B1中的所有特征图、S1中的所有特征图、S2中的所有特征图、B2中的所有特征图、S3中的所有特征图、S4中的所有特征图,Concatanate融合层的输出端输出1408幅特征图,将输出的所有特征图构成的集合记为C1,其中,C1中的每幅特征图的宽度为 高度为 第4个激活层的输入端接收C1中的所有特征图,第4个激活层的输出端输出1408幅特征图,将输出的所有特征图构成的集合记为H4,其中,H4中的每幅特征图的宽度为 高度为 第4个卷积层的输入端接收H4中的所有特征图,第4个卷积层的输出端输出1024幅特征图,将输出的所有特征图构成的集合记为J4,其中,J4中的每幅特征图的宽度为 高度为 第4个批规范化层的输入端接收J4中的所有特征图,第4个批规范化层的输出端输出1024幅特征图,将输出的所有特征图构成的集合记为P4,其中,P4中的每幅特征图的宽度为 高度为 第5个激活层的输入端接收P4中的所有特征图,第5个激活层的输出端输出1024幅特征图,将输出的所有特征图构成的集合记为H5,其中,H5中的每幅特征图的宽度为 高度为 第1个反卷积层的输入端接收H5中的所有特征图,第1个反卷积层的输出端输出64幅特征图,将输出的所有特征图构成的集合记为F1,其中,F1中的每幅特征图的宽度为 高度为 第5个批规范化层的输入端接收F1中的所有特征图,第5个批规范化层的输出端输出64幅特征图,将输出的所有特征图构成的集合记为P5,其中,P5中的每幅特征图的宽度为 高度为 第1个可分离卷积层的输入端接收H3中的所有特征图,第1个可分离卷积层的输出端输出64幅特征图,将输出的所有特征图构成的集合记为K1,其中,K1中的每幅特征图的宽度为 高度为 第9个批规范化层的输入端接收K1中的所有特征图,第9个批规范化层的输出端输出64幅特征图,将输出的所有特征图构成的集合记为P9,其中,P9中的每幅特征图的宽度为 高度为 第1个Add融合层的输入端接收P9中的所有特征图和P5中的所有特征图,第1个Add融合层的输出端输出64幅特征图,将输出的所有特征图构成的集合记为A1,其中,A1中的每幅特征图的宽度为 高度为 第6个激活层的输入端接收A1中的所有特征图,第6个激活层的输出端输出64幅特征图,将输出的所有特征图构成的集合记为H6,其中,H6中的每幅特征图的宽度为 高度为 第2个反卷积层的输入端接收H6中的所有特征图,第2个反卷积层的输出端输出32幅特征图,将输出的所有特征图构成的集合记为F2,其中,F2中的每幅特征图的宽度为 高度为 第6个批规范化层的输入端接收F2中的所有特征图,第6个批规范化层的输出端输出32幅特征图,将输出的所有特征图构成的集合记为P6,其中,P6中的每幅特征图的宽度为 高度为 第2个可分离卷积层的输入端接收H2中的所有特征图,第2个可分离卷积层的输出端输出32幅特征图,将输出的所有特征图构成的集合记为K2,其中,K2中的每幅特征图的宽度为 高度为 第10个批规范化层的输入端接收K2中的所有特征图,第10个批规范化层的输出端输出32幅特征图,将输出的所有特征图构成的集合记为P10,其中,P10中的每幅特征图的宽度为 高度为 第2个Add融合层的输入端接收P10中的所有特征图和P6中的所有特征图,第2个Add融合层的输出端输出32幅特征图,将输出的所有特征图构成的集合记为A2,其中,A2中的每幅特征图的宽度为 高度为 第7个激活层的输入端接收A2中的所有特征图,第7个激活层的输出端输出32幅特征图,将输出的所有特征图构成的集合记为H7,其中,H7中的每幅特征图的宽度为 高度为 第3个反卷积层的输入端接收H7中的所有特征图,第3个反卷积层的输出端输出16幅特征图,将输出的所有特征图构成的集合记为F3,其中,F3中的每幅特征图的宽度为R、高度为L;第7个批规范化层的输入端接收F3中的所有特征图,第7个批规范化层的输出端输出16幅特征图,将输出的所有特征图构成的集合记为P7,其中,P7中的每幅特征图的宽度为R、高度为L;第3个可分离卷积层的输入端接收H1中的所有特征图,第3个可分离卷积层的输出端输出16幅特征图,将输出的所有特征图构成的集合记为K3,其中,K3中的每幅特征图的宽度为R、高度为L;第11个批规范化层的输入端接收K3中的所有特征图,第11个批规范化层的输出端输出16幅特征图,将输出的所有特征图构成的集合记为P11,其中,P11中的每幅特征图的宽度为R、高度为L;第3个Add融合层的输入端接收P11中的所有特征图和P7中的所有特征图,第3个Add融合层的输出端输出16幅特征图,将输出的所有特征图构成的集合记为A3,其中,A3中的每幅特征图的宽度为R、高度为L;第8个激活层的输入端接收A3中的所有特征图,第8个激活层的输出端输出16幅特征图,将输出的所有特征图构成的集合记为H8,其中,H8中的每幅特征图的宽度为R、高度为L;第5个卷积层的输入端接收H8中的所有特征图,第5个卷积层的输出端输出1幅特征图,将输出的所有特征图构成的集合记为J5,其中,J5中的每幅特征图的宽度为R、高度为L;第8个批规范化层的输入端接收J5中的所有特征图,第8个批规范化层的输出端输出1幅特征图,将输出的所有特征图构成的集合记为P8,其中,P8中的每幅特征图的宽度为R、高度为L;第9个激活层的输入端接收P8中的所有特征图,第9个激活层的输出端输出1幅特征图,将输出的所有特征图构成的集合记为H9,其中,H9中的每幅特征图的宽度为R、高度为L;

对于输出层,输出层的输入端接收H9中的特征图,输出层的输出端输出一幅原始输入图像对应的估计深度图像;其中,估计深度图像的宽度为R、高度为L;

步骤1_3:将训练集中的每幅原始的单目图像作为原始输入图像,输入到卷积神经网络中进行训练,得到训练集中的每幅原始的单目图像对应的估计深度图像,将{Qn(x,y)}对应的估计深度图像记为 其中, 表示 中坐标位置

为(x,y)的像素点的像素值;

步骤1_4:计算训练集中的每幅原始的单目图像对应的估计深度图像与对应的真实深度图像之间的损失函数值,将 与 之间的损失函数值记为

步骤1_5:重复执行步骤1_3和步骤1_4共V次,得到训练好的深度可分卷积神经网络训练模型,并共得到N×V个损失函数值;然后从N×V个损失函数值中找出值最小的损失函数值;接着将值最小的损失函数值对应的权值矢量和偏置项对应作为训练好的深度可分卷积神经网络训练模型的最优权值矢量和最优偏置项,对应记为Wbest和bbest;其中,V>1;

所述的测试阶段过程的具体步骤为:

步骤2_1:令{Q(x',y')}表示待预测的单目图像;其中,1≤x'≤R',1≤y'≤L',R'表示{Q(x',y')}的宽度,L'表示{Q(x',y')}的高度,Q(x',y')表示{Q(x',y')}中坐标位置为(x',y')的像素点的像素值;

步骤2_2:将{Q(x',y')}输入到训练好的深度可分卷积神经网络训练模型中,并利用Wbest和bbest进行预测,得到{Q(x',y')}对应的预测深度图像,记为{Qdepth(x',y')};其中,Qdepth(x',y')表示{Qdepth(x',y')}中坐标位置为(x',y')的像素点的像素值。

2.根据权利要求1所述的一种基于深度可分卷积神经网络的视觉深度估计方法,其特征在于所述的步骤1_2中,对于第1个深度可分卷积网络块,卷积层的输入端接收B1中的所有特征图,卷积层的输出端输出128幅特征图,将输出的所有特征图构成的集合记为J11,其中,J11中的每幅特征图的宽度为 高度为 第1个批规范化层的输入端接收J11中的所有特征图,第1个批规范化层的输出端输出128幅特征图,将输出的所有特征图构成的集合记为P11,其中,P11中的每幅特征图的宽度为 高度为 第1个可分离卷积层的输入端接收B1中的所有特征图,第1个可分离卷积层的输出端输出128幅特征图,将输出的所有特征图构成的集合记为K11,其中,K11中的每幅特征图的宽度为 高度为 第2个批规范化层的输入端接收K11中的所有特征图,第2个批规范化层的输出端输出128幅特征图,将输出的所有特征图构成的集合记为P12,其中,P12中的每幅特征图的宽度为 高度为 第1个激活层的输入端接收P12中的所有特征图,第1个激活层的输出端输出128幅特征图,将输出的所有特征图构成的集合记为H11,其中,H11中的每幅特征图的宽度为 高度为 带孔可分离卷积层的输入端接收H11中的所有特征图,带孔可分离卷积层的输出端输出128幅特征图,将输出的所有特征图构成的集合记为L11,其中,L11中的每幅特征图的宽度为 高度为 第3个批规范化层的输入端接收L11中的所有特征图,第3个批规范化层的输出端输出

128幅特征图,将输出的所有特征图构成的集合记为P13,其中,P13中的每幅特征图的宽度为高度为 第2个激活层的输入端接收P13中的所有特征图,第2个激活层的输出端输出

128幅特征图,将输出的所有特征图构成的集合记为H12,其中,H12中的每幅特征图的宽度为高度为 第2个可分离卷积层的输入端接收H12中的所有特征图,第2个可分离卷积层的输出端输出128幅特征图,将输出的所有特征图构成的集合记为K12,其中,K12中的每幅特征图的宽度为 高度为 第4个批规范化层的输入端接收K12中的所有特征图,第4个批规范化层的输出端输出128幅特征图,将输出的所有特征图构成的集合记为P14,其中,P14中的每幅特征图的宽度为 高度为 Add融合层的输入端接收P11中的所有特征图和P14中的所有特征图,Add融合层的输出端输出128幅特征图,将输出的所有特征图构成的集合记为A11,其中,A11中的每幅特征图的宽度为 高度为 第3个激活层的输入端接收A11中的所有特征图,第3个激活层的输出端输出128幅特征图,将输出的所有特征图构成的集合记为H13,将H13作为S1,其中,H13中的每幅特征图的宽度为 高度为对于第2个深度可分卷积网络块,卷积层的输入端接收S1中的所有特征图,卷积层的输出端输出128幅特征图,将输出的所有特征图构成的集合记为J21,其中,J21中的每幅特征图的宽度为 高度为 第1个批规范化层的输入端接收J21中的所有特征图,第1个批规范化层的输出端输出128幅特征图,将输出的所有特征图构成的集合记为P21,其中,P21中的每幅特征图的宽度为 高度为 第1个可分离卷积层的输入端接收S1中的所有特征图,第1个可分离卷积层的输出端输出128幅特征图,将输出的所有特征图构成的集合记为K21,其中,K21中的每幅特征图的宽度为 高度为 第2个批规范化层的输入端接收K21中的所有特征图,第2个批规范化层的输出端输出128幅特征图,将输出的所有特征图构成的集合记为P22,其中,P22中的每幅特征图的宽度为 高度为 第1个激活层的输入端接收P22中的所有特征图,第1个激活层的输出端输出128幅特征图,将输出的所有特征图构成的集合记为H21,其中,H21中的每幅特征图的宽度为 高度为 带孔可分离卷积层的输入端接收H21中的所有特征图,带孔可分离卷积层的输出端输出128幅特征图,将输出的所有特征图构成的集合记为L21,其中,L21中的每幅特征图的宽度为 高度为 第3个批规范化层的输入端接收L21中的所有特征图,第3个批规范化层的输出端输出128幅特征图,将输出的所有特征图构成的集合记为P23,其中,P23中的每幅特征图的宽度为 高度为 第2个激活层的输入端接收P23中的所有特征图,第2个激活层的输出端输出128幅特征图,将输出的所有特征图构成的集合记为H22,其中,H22中的每幅特征图的宽度为 高度为 第2个可分离卷积层的输入端接收H22中的所有特征图,第2个可分离卷积层的输出端输出128幅特征图,将输出的所有特征图构成的集合记为K22,其中,K22中的每幅特征图的宽度为 高度为 第4个批规范化层的输入端接收K22中的所有特征图,第4个批规范化层的输出端输出128幅特征图,将输出的所有特征图构成的集合记为P24,其中,P24中的每幅特征图的宽度为 高度为 Add融合层的输入端接收P21中的所有特征图和P24中的所有特征图,Add融合层的输出端输出128幅特征图,将输出的所有特征图构成的集合记为A21,其中,A21中的每幅特征图的宽度为 高度为 第3个激活层的输入端接收A21中的所有特征图,第3个激活层的输出端输出128幅特征图,将输出的所有特征图构成的集合记为H23,将H23作为S2,其中,H23中的每幅特征图的宽度为 高度为对于第3个深度可分卷积网络块,卷积层的输入端接收B2中的所有特征图,卷积层的输出端输出256幅特征图,将输出的所有特征图构成的集合记为J31,其中,J31中的每幅特征图的宽度为 高度为 第1个批规范化层的输入端接收J31中的所有特征图,第1个批规范化层的输出端输出256幅特征图,将输出的所有特征图构成的集合记为P31,其中,P31中的每幅特征图的宽度为 高度为 第1个可分离卷积层的输入端接收B2中的所有特征图,第1个可分离卷积层的输出端输出256幅特征图,将输出的所有特征图构成的集合记为K31,其中,K31中的每幅特征图的宽度为 高度为 第2个批规范化层的输入端接收K31中的所有特征图,第2个批规范化层的输出端输出256幅特征图,将输出的所有特征图构成的集合记为P32,其中,P32中的每幅特征图的宽度为 高度为 第1个激活层的输入端接收P32中的所有特征图,第1个激活层的输出端输出256幅特征图,将输出的所有特征图构成的集合记为H31,其中,H31中的每幅特征图的宽度为 高度为 带孔可分离卷积层的输入端接收H31中的所有特征图,带孔可分离卷积层的输出端输出256幅特征图,将输出的所有特征图构成的集合记为L31,其中,L31中的每幅特征图的宽度为 高度为 第3个批规范化层的输入端接收L31中的所有特征图,第3个批规范化层的输出端输出256幅特征图,将输出的所有特征图构成的集合记为P33,其中,P33中的每幅特征图的宽度为 高度为 第2个激活层的输入端接收P33中的所有特征图,第2个激活层的输出端输出256幅特征图,将输出的所有特征图构成的集合记为H32,其中,H32中的每幅特征图的宽度为 高度为 第2个可分离卷积层的输入端接收H32中的所有特征图,第2个可分离卷积层的输出端输出256幅特征图,将输出的所有特征图构成的集合记为K32,其中,K32中的每幅特征图的宽度为 高度为 第4个批规范化层的输入端接收K32中的所有特征图,第4个批规范化层的输出端输出256幅特征图,将输出的所有特征图构成的集合记为P34,其中,P34中的每幅特征图的宽度为 高度为 Add融合层的输入端接收P31中的所有特征图和P34中的所有特征图,Add融合层的输出端输出256幅特征图,将输出的所有特征图构成的集合记为A31,其中,A31中的每幅特征图的宽度为 高度为 第3个激活层的输入端接收A31中的所有特征图,第3个激活层的输出端输出256幅特征图,将输出的所有特征图构成的集合记为H33,将H33作为S3,其中,H33中的每幅特征图的宽度为 高度为对于第4个深度可分卷积网络块,卷积层的输入端接收S3中的所有特征图,卷积层的输出端输出512幅特征图,将输出的所有特征图构成的集合记为J41,其中,J41中的每幅特征图的宽度为 高度为 第1个批规范化层的输入端接收J41中的所有特征图,第1个批规范化层的输出端输出512幅特征图,将输出的所有特征图构成的集合记为P41,其中,P41中的每幅特征图的宽度为 高度为 第1个可分离卷积层的输入端接收S3中的所有特征图,第1个可分离卷积层的输出端输出512幅特征图,将输出的所有特征图构成的集合记为K41,其中,K41中的每幅特征图的宽度为 高度为 第2个批规范化层的输入端接收K41中的所有特征图,第2个批规范化层的输出端输出512幅特征图,将输出的所有特征图构成的集合记为P42,其中,P42中的每幅特征图的宽度为 高度为 第1个激活层的输入端接收P42中的所有特征图,第1个激活层的输出端输出512幅特征图,将输出的所有特征图构成的集合记为H41,其中,H41中的每幅特征图的宽度为 高度为 带孔可分离卷积层的输入端接收H41中的所有特征图,带孔可分离卷积层的输出端输出512幅特征图,将输出的所有特征图构成的集合记为L41,其中,L41中的每幅特征图的宽度为 高度为 第3个批规范化层的输入端接收L41中的所有特征图,第3个批规范化层的输出端输出512幅特征图,将输出的所有特征图构成的集合记为P43,其中,P43中的每幅特征图的宽度为 高度为 第2个激活层的输入端接收P43中的所有特征图,第2个激活层的输出端输出512幅特征图,将输出的所有特征图构成的集合记为H42,其中,H42中的每幅特征图的宽度为 高度为 第2个可分离卷积层的输入端接收H42中的所有特征图,第2个可分离卷积层的输出端输出512幅特征图,将输出的所有特征图构成的集合记为K42,其中,K42中的每幅特征图的宽度为 高度为 第4个批规范化层的输入端接收K42中的所有特征图,第4个批规范化层的输出端输出512幅特征图,将输出的所有特征图构成的集合记为P44,其中,P44中的每幅特征图的宽度为 高度为 Add融合层的输入端接收P41中的所有特征图和P44中的所有特征图,Add融合层的输出端输出512幅特征图,将输出的所有特征图构成的集合记为A41,其中,A41中的每幅特征图的宽度为 高度为 第3个激活层的输入端接收A41中的所有特征图,第3个激活层的输出端输出512幅特征图,将输出的所有特征图构成的集合记为H43,将H43作为S4,其中,H43中的每幅特征图的宽度为 高度为

3.根据权利要求1或2所述的一种基于深度可分卷积神经网络的视觉深度估计方法,其特征在于所述的步骤1_4中, 采用均方误差函数获得。