1.一种基于区域和深度残差网络的图像语义分割方法,包括以下步骤:步骤(1):在使用Selective Search在图像上生成候选区域的基础上,将每个候选区域缩放为四种不同的尺度,每个候选区域由三部分进行描述:边界框、前景掩膜、前景大小;
步骤(2):在原残差网络ResNet‑50的基础上,在第四层与第五层卷积层中加入扩张因子,并将这两层的步长设为1;
步骤(3):将图像输入到由步骤(2)得到的带扩张卷积的深度残差网络中进行特征提取,得到特征图;
步骤(4):将由步骤(1)得到的候选区域与步骤(3)得到的特征图输入到ROI池化层中,得到区域特征;结合前景掩膜得到区域前景特征,将区域特征与区域前景特征进行串联;
步骤(5):将步骤(4)中串联后特征通过全局平均池化层进行逐像素分类,得到每个像素的类别预测值;
步骤(6):对步骤(1)中每个尺度的候选区域,保持模型中其他参数不变,分别进行训练最终得到四个模型;
步骤(7):将测试集图像分别通过这四个模型,并将其在分类层中得到的特征进行融合,使用融合后的特征进行预测,对分割效果进行分析。