1.一种基于深度学习的肺炎图像分类方法,其特征在于,该方法是通过使用迁移学习作为初始化数据,对所选取的肺部x图像样本数据进行增强处理,提取样本特征之间的关联,再将提取到的样本特征映射到输出空间上进行肺部x图像的分类;具体如下:数据预处理:获取肺部x图像数据集,对肺部x图像数据集中的训练集进行数据预处理;
Lsception模型融合:通过Lsception模型对肺部x图像进行特征提取,通过提取的肺部特征完成对肺部x图像的预测分类;具体如下:预处理后的肺部x图像输入到输入块,得出四维特征数据;
输出块输出的四维特征数据输入到中间块,输出四维肺炎特征数据;
中间块输出的四维肺炎特征数据输入到输出块,获取K个肺炎特征;
将K个肺炎特征输入到长短记忆循环神经网络,经历三个阶段,分别是忘记阶段、选择记忆阶段及输出阶段,对肺炎图像的特征更加精确的识别;
Lsception模型的体系结构是由36个卷积层和一个长短记忆循环神经网络组成;将36个卷积层划分为14个模块,14个模块中除了第一个模块和最后一个模块外,其余模块都具有线性残差连接,完全是基于深度可分卷积层的卷积神经网络架构;36个卷积层总体划分为输入块、中间块和输出块;
其中,输入块用于不断下采样,减少空间维度;
中间块用于不断分析,过滤特征;
输出块用于下降参数个数;
Lsception模型优化:通过优化器、损失函数、数据评估及超参数修改优化Lsception模型;
其中,优化器采用RMSprop优化器,通过RMSprop优化器对参数进行自动调节,具体公式如下:
2
Tdv=αTdv+(1‑α)(dv) ;
2
Tdb=αTdb+(1‑α)(db) ;
2 2
其中,(dv) 及(db) 表示对向量的各个分量分别计算平方;Tdv与Tdb展开也是一个向量,每个分量是权重dv、db对应分量值的平方的指数加权移动平均;α控制加权平均数;v表示着在横轴上的参数,为均衡Tdv和Tdb之间变化幅度,从而更新参数值V、b,V的变化通过如下公式表示:
b的变化通过如下公式表示:
其中,γ表示超参数;
所述损失函数具体如下:
设数据通过Lsception模型预测后的输出概率为 真实标签值的概率为p=[p1,p2,...,pt],;其中,t表示数据总数量,以binary_crossentropy为基础,损失函数公式如下:
2
其中,x表示衡量实际值与预测值的差异程度;p表示当前真实标签值;表示当前预测标签值;L表示损失函数;
融合皮尔逊提出的特征选择的方法,公式为:进一步,得出损失函数公式为:数据评估及超参数修改具体如下:通过对数据集划分,发现患有肺炎患者的数量明显高于正常数量的患者,样本不平衡,通过计算训练集的不平衡比IR,公式如下:其中,Max_class表示数据集中所占数量多的类别;Min_class代表数据集中所占少的类别;
根据IR的值是否大于1.5来判断训练集的平衡性;数据集的不平衡会引起分类性能的改变,为了更加合理均衡类别比,选择对权重值进行平衡,修改超参数类别权重,公式如下:Wm=i_sum/(i_class*i_summ);
其中,Wm表示每个类的最终计算得出的权重值;i_sum表示该类数据集中所有样本量;i_class表示总样本中类别数目;i_summ表示在m类别所对应样本数目;
评价预测结果:采用不同评价指标评价预测结果;具体如下:评价指标准确率的目的为检测正确分类的正例个数占总样本数之比,公式如下:其中,Accuracy表示评价指标准确率;TP表示标签和预测都为正常人的数量;FN表示标签为正常人,预测为患有肺炎的数量;FP表示标签为患有肺炎,预测为正常人的数量;TN表示标签和预测都为患有肺炎的数量;
精准率反映为预测正例的样本数占正例的实例个数的比例,目的是为了衡量查准率,公式如下:
其中,Precision表示精准率;
召回率反映预测为正例的样本数占所有正样本个数的比例,目的是衡量查全率,公式如下:
其中,Recall表示召回率;
在精准率和召回率的基础上提出了F1值的概念,来对精准率和召回率进行整体评价,公式如下:
2.根据权利要求1所述的基于深度学习的肺炎图像分类方法,其特征在于,数据预处理具体如下:
尺度变换:对肺部x图像进行尺度变换,尺度变换的缩放因子为1/255,通过尺度变换将肺部x图像的长度和宽度放大或缩小,进而改变肺部x图像的整体大小;
旋转或反射变换:对肺部x图像进行随机旋转角度,即绕肺部x图像的中心旋转角度,旋转角度的范围内为±7度;
宽度移动:对肺部x图像在水平方向上移动±0.2%~±0.5%;
高度移动:对肺部x图像在垂直方向上移动±0.2%~±0.5%;
剪切:对肺部x图像剪切范围为±0.2%;
缩放:随机对肺部x图像进行0.45倍的放大或缩小;
水平翻转图像:将肺部x图像再次进行水平方向的翻转。
3.根据权利要求1所述的基于深度学习的肺炎图像分类方法,其特征在于,预处理后的肺部x图像输入到输入块,具体如下:(一)、传入尺寸为224*224的肺部x图像,经过两层卷积,从原始输入层中提取肺炎x图像中基础特征;具体为:通过对肺部x图像处理,将两肺纹理增粗、肺野内带可见斑片状阴影、密度不均匀、边缘模糊不清的基础特征提取出来;在输入块中,第一个数字表示过滤器大小,第二个数字表示卷积核大小,最后一个数字表示步幅的大小;同时,伴随RELU激活函数,增强卷积层中提取出来特征的稀疏性;
(二)、在经卷积处理时,分别学习feature channels间的关联关系与feature单个channel内部空间上的关联关系,使用大量的1x1大小的卷积核来重视学习;随后链接两层深度可分离卷积,对卷积层中提取的特征图数量进行调整,最后通过池化层,运用2*2的步长降维提取重要特征;
(三)、通过增加过滤器数量,减少参数数量,得出四维特征数据;
输出块输出的四维特征数据输入到中间块,具体如下:运用三层过滤层为728,卷积核个数为3*3的深度可分离卷积,每层深度可分离卷积后,都有RELU作为激活函数,重复8次的中间流,将肺炎胸片可见细支气管壁增厚、肺门周围的线性高密度、细支气管周围实变、常为双侧以及表现为斑片状肺膨胀不全、常合并支气管壁增厚和马赛克样肺灌注的进行深度特征整合,输出四维肺炎特征数据。
4.根据权利要求1所述的基于深度学习的肺炎图像分类方法,其特征在于,中间块输出的四维肺炎特征数据输入到输出块,具体如下:(1)、将中间块下深度提取的四维特征再进行两次深度可分离卷积伴随RELU激活函数,进一步下降参数个数;
(2)、将1x1 Conv输出的feature maps进行分割;
(3)、与两个高维深度可分卷积层结合,伴随RELU激活函数,获取K个肺炎特征;
将K个肺炎特征输入到长短记忆循环神经网络,经历三个阶段,分别是忘记阶段、选择记忆阶段及输出阶段,对肺炎图像的特征更加精确的识别,具体如下:①、K个肺炎特征中输出的四维结构中,将第三维和第四维进行相乘,转换成LSTM可运行的三维结构进行读取;
②、将提取到的K个肺炎特征中重叠且不明确的特征部分进行遗忘,选择去记忆现在重要信息,最终学会运用将过去记忆与现在记忆合并来提高医学诊断的真实性和有效性;
③、通过Lsception模型的肺炎图像特征提取完成后,通过四层dense全连接,前三层神经元个数通过逐层2倍递减的速度下降,同时伴随RELU激活函数,将以前的局部特征重新通过权值矩阵组装成完整的图;
④、最后一层通过选择sigmoid激活函数进行预测分类,并对其中超参数进行微调。
5.一种基于深度学习的肺炎图像分类系统,其特征在于,该系统包括,预处理模块,用于获取肺部x图像数据集,对肺部x图像数据集中的训练集进行数据预处理;
融合模块,用于通过Lsception模型对肺部x图像进行特征提取,通过提取的肺部特征完成对肺部x图像的预测分类;融合模块具体如下:预处理后的肺部x图像输入到输入块,得出四维特征数据;
输出块输出的四维特征数据输入到中间块,输出四维肺炎特征数据;
中间块输出的四维肺炎特征数据输入到输出块,获取K个肺炎特征;
将K个肺炎特征输入到长短记忆循环神经网络,经历三个阶段,分别是忘记阶段、选择记忆阶段及输出阶段,对肺炎图像的特征更加精确的识别;
Lsception模型的体系结构是由36个卷积层和一个长短记忆循环神经网络组成;将36个卷积层划分为14个模块,14个模块中除了第一个模块和最后一个模块外,其余模块都具有线性残差连接,完全是基于深度可分卷积层的卷积神经网络架构;36个卷积层总体划分为输入块、中间块和输出块;
其中,输入块用于不断下采样,减少空间维度;
中间块用于不断分析,过滤特征;
输出块用于下降参数个数;
优化模块,用于通过优化器、损失函数、数据评估及超参数修改优化Lsception模型;其中,优化器采用RMSprop优化器,通过RMSprop优化器对参数进行自动调节,具体公式如下:2
Tdv=αTdv+(1‑α)(dv) ;
2
Tdb=αTdb+(1‑α)(db) ;
2 2
其中,(dv) 及(db) 表示对向量的各个分量分别计算平方;Tdv与Tdb展开也是一个向量,每个分量是权重dv、db对应分量值的平方的指数加权移动平均;α控制加权平均数;v表示着在横轴上的参数,为均衡Tdv和Tdb之间变化幅度,从而更新参数值V、b,V的变化通过如下公式表示:
b的变化通过如下公式表示:
其中,γ表示超参数;
所述损失函数具体如下:
设数据通过Lsception模型预测后的输出概率为 真实标签值的概率为p=[p1,p2,...,pt],;其中,t表示数据总数量,以binary_crossentropy为基础,损失函数公式如下:
2
其中,x表示衡量实际值与预测值的差异程度;p表示当前真实标签值;表示当前预测标签值;L表示损失函数;
融合皮尔逊提出的特征选择的方法,公式为:进一步,得出损失函数公式为:数据评估及超参数修改具体如下:通过对数据集划分,发现患有肺炎患者的数量明显高于正常数量的患者,样本不平衡,通过计算训练集的不平衡比IR,公式如下:其中,Max_class表示数据集中所占数量多的类别;Min_class代表数据集中所占少的类别;
根据IR的值是否大于1.5来判断训练集的平衡性;数据集的不平衡会引起分类性能的改变,为了更加合理均衡类别比,选择对权重值进行平衡,修改超参数类别权重,公式如下:Wm=i_sum/(i_class*i_summ);
其中,Wm表示每个类的最终计算得出的权重值;i_sum表示该类数据集中所有样本量;i_class表示总样本中类别数目;i_summ表示在m类别所对应样本数目;
评价模块,用于采用不同评价指标评价预测结果;评价模块具体如下:评价指标准确率的目的为检测正确分类的正例个数占总样本数之比,公式如下:其中,Accuracy表示评价指标准确率;TP表示标签和预测都为正常人的数量;FN表示标签为正常人,预测为患有肺炎的数量;FP表示标签为患有肺炎,预测为正常人的数量;TN表示标签和预测都为患有肺炎的数量;
精准率反映为预测正例的样本数占正例的实例个数的比例,目的是为了衡量查准率,公式如下:
其中,Precision表示精准率;
召回率反映预测为正例的样本数占所有正样本个数的比例,目的是衡量查全率,公式如下:
其中,Recall表示召回率;
在精准率和召回率的基础上提出了F1值的概念,来对精准率和召回率进行整体评价,公式如下:
6.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,所述计算机程序可被处理器执行以实现如权利要求1至4中任一项所述的基于深度学习的肺炎图像分类方法。