1.一种基于GAN的医学图像病变区域弱监督定位方法,其特征在于,所述方法包括:步骤1:制作数据集,采集正常人和病人的胸部CT图像并将对其进行预处理,将预处理后的CT扫描图像保存为NPY格式并按比例分为训练数据集和验证数据集;
步骤2:预训练分类器网络,将训练数据集输入到构建好的分类器网络中进行训练,训练完成后使用验证数据集进行验证,保存验证效果最好的网络模型,该预训练的分类器将作为后续生成对抗网络模型中的关键附加组件;
步骤3:训练生成对抗网络,所述生成对抗网络包括用于生成伪图像的生成器和用于判别真实图像和伪图像的判别器,还包括步骤2中训练好的分类器;训练方法具体包括:将训练数据集中的病人数据样本输入到生成器,然后将训练数据集中的正常人数据样本和生成器生成的伪图像输入到判别器,同时将生成器生成的伪图像输入到步骤2训练好的分类器,交替训练生成器和判别器;
具体的训练步骤如下:
步骤31:将训练数据集中的病人CT图像输入到生成器,生成一幅指示病变区域的图像;
步骤32:将生成器生成的病变区域图像叠加到步骤31中的所述病人CT图像上获得类似正常人CT图像的伪正常人CT图像;
步骤33:训练生成器,冻结判别器的参数,将所述伪正常人CT图像和所述正常人CT图像输入到判别器,同时将所述伪正常人CT图像输入到步骤2训练好的分类器中;
生成器的优化目标是真实数据分布和伪数据分布之间的JS散度,当该值足够小时,说明两者的分布近似,即生成器生成的伪正常人CT图像和正常人CT图像具有相同的数据分布,此步要求判别器把输入的伪图像判断为真实图像,即生成器成功的伪造出数据来“欺骗”判别器;
生成器的目标函数由四种误差项构成,通过反向传播算法计算梯度,并使用梯度下降法更新生成器的参数;
步骤34:训练判别器,冻结生成器的参数,在步骤32后,将所述伪正常人CT图像和所述正常人CT图像输入到判别器,与步骤33相反,此步要求判别器对伪造图像判断为假,即判别器能成功的识破生成器的造假行为;
判别器定义为由一组参数 参数化的函数 对于伪正常人CT图像判别器应当将其判断为假,对于正常人CT图像判别器应当判断为真,通过下述公式计算误差,并更新判别器的参数使其能做出更准确的判断;误差计算公式如下:其中z=G(x),其中D,G分别代表生成器和判别器,Preal,Pfake分别代表正常人的分布和生成器生成的伪正常人的分布;
当判别器对于所述伪正常人图像和正常人图像的输出概率达到平衡状态,且分类器对于所述伪正常人图像分类为正常人的概率较高时,表示生成对抗网络训练完成;
步骤4:验证训练好的弱监督定位网络性能,将验证数据集中的病人CT数据输入到训练完成的生成器中,获得其病变区域,具体步骤包括:步骤41:使用与步骤1中相同的预处理方式处理病人CT数据,然后将其输入到步骤3已经训练完成的生成器中;
步骤42:将生成器的输出叠加到生成器的输入图像上并通过Tanh激活函数限制像素值的范围,然后减去输入图像并取绝对值后便可获得病变区域定位图。
2.如权利要求1所述的病变区域弱监督定位方法,其特征在于,所述分类器网络的训练方法具体包括:步骤21:将训练数据集中的胸部CT图像输入到ResNet网络中,提取输入图像的高级语义特征并生成特征图;其中,高级语义特征包括边缘,线条,纹理,颜色等人类视觉可以理解的特征以及更为抽象的人类无法理解但机器能做出判断的高级特征;
步骤22:将所述特征图经过全局平均池化后通过全连接层,输出所述胸部CT图像为病人或正常人的概率,并根据步骤1制作数据集时已知的标签信息计算误差,依据计算出的误差使用反向传播算法计算出各个参数的梯度并使用梯度下降算法更新神经网络参数,最后得到一个最优的分类器函数fθ(x)能正确地对输入数据分类;
步骤23:当训练数据集中的所有训练数据迭代一次后,将验证数据集输入到训练完成的分类器中,评估分类器效果,最终保存验证指标最高的分类器模型。
3.如权利要求2所述的病变区域弱监督定位方法,其特征在于,所述方法包括:预处理后的病人胸部CT图像和正常人胸部CT图像分别构成病人数据集和正常人数据集,一次CT扫描图像存成一个文件夹,根据文件名保存对应的标签信息;
预处理包括重采样到固定的分辨率并进行归一化处理使所有数据的像素值范围为-1到1,标签信息为正常人或病人。
4.如权利要求3所述的病变区域弱监督定位方法,其特征在于,步骤22计算误差的方法具体为:使用二分类交叉熵损失函数来计算误差,误差计算公式如下:CrossEntropy(x,y)=-[ylogp(x)+(1-y)log(1-p(x))]x代表输入的图像,y代表其对应的标签信息,病人和正常人的标签信息分别为0和1,p(x)代表分类器输出的x是病人或正常人的概率,当预测值p(x)与标签y相等时,此公式可以得到最小值0,分类器定义为一个由一组参数θ参数化的函数fθ(x),该函数使用神经网络来实现。
5.如权利要求4所述的病变区域弱监督定位方法,其特征在于,生成器的目标函数的四种误差项具体如下:第一误差项为判别器的输出,即伪正常人CT图像和真实正常人CT图像在数据的概率分布上的误差;
第二误差项是分类器的输出,即分类器提取输入数据的高级语义特征并依据这些高级语义特征来判断输入数据是正常人数据的可能性,可以表述成输入分类器的伪正常人CT图像和正常人CT图像之间在高级语义特征上的误差;
第三误差项是在生成器的输入数据和输出的伪正常人CT图像之间施加了1范数的约束来作为重构误差,目的是保证输入和输出的相似性,减少无关区域的噪声表达;
第四误差项是在生成器生成的病变区域图上施加了1范数约束,目的是保证尽量少的病变区域覆盖就可以转化为一个正常人,同样是为了减少无关噪声表达。
6.如权利要求5所述的病变区域弱监督定位方法,其特征在于,步骤42预测病变区域的公式如下:output=|Tanh(x+g(x))-x|
其中,x输入生成器的数据,g(x)代表生成器的输出,Tanh激活函数的作用是保证输出图像的像素值在(-1,1)之间以免溢出,output即最后得到的指示病变区域的图像。