1.一种基于卷积神经网络检测CT图像的方法,其特征在于,包括如下步骤:
S1、提供病人的CT图像、基因组表达谱、蛋白质表达谱、吸烟情况和工作环境信息,并对CT图像进行标注获得数据集;
S2、根据步骤S1所述信息搭建一个主要神经网络和四个次要神经网络,其中,主要神经网络以卷积神经网络为主体,四个次要神经网络分别用于分析基因组表达谱、蛋白质表达谱、吸烟情况和工作环境对病人病情影响的大小并输出相应的权值;
S3、用已标注的数据集对所述主要神经网络进行训练,代入所述次要神经网络输出的权值,以判断病人的CT图像是否具有肺癌相应特征。
2.根据权利要求1所述的方法,其特征在于,所述主体由输入层、隐藏层和输出层构成,所述输入层输入CT图像,隐藏层由四层卷积层和两层平均池化层构成,每两层卷积层后面连接一层平均池化层,所述输出层用softmax将输出结果变成概率输出,两个概率值的和为
1,其中更接近1的是正确值。
3.根据权利要求1所述的方法,其特征在于,所述S1包括如下步骤:
S11、需从病人的CT扫描中获取肺部的CT切片;
S12、需要对病人的基因组进行检测,对病人进行验血检测蛋白质表达情况,咨询吸烟情况,咨询工作环境;
S13、将获取的CT图像进行标注。
4.根据权利要求1所述的方法,其特征在于,所述主要神经网络由一个卷积层(C1),leaky_relu激活,第二个卷积层(C2),leaky_relu激活,第一个池化层(P1,大小2x2),第三个卷积层(C3),leaky_relu激活,第四个卷积层(C4),leaky_relu激活,第二层池化层(P2,大小2x2),第五层卷积层(C5),leaky_relu激活,第六层卷积层(C6),leaky_relu激活,第三层池化层(P3,大小7x7),然后经过softmax将输出值变成概率输出构成。
5.根据权利要求1所述的方法,其特征在于,用于分析基因组表达谱的次要神经网络中,用0和1来代表基因未表达和表达,搭建分析基因组因素的神经网络;先将基因组表达与否和是否患病关联起来,收集的有关基因数目为36个,组成大小为【6,6】的数组,该数组将只有0和1两个值,每一个数组对应一个患者,给该数组贴上标签是否患病;该神经网络只有一层卷积层,该层卷积层采用的是大小为【2,2】,步长为1,通道数为2的卷积核进行卷积;其输出层把卷积层的输出值经过softmax处理变成概率输出,然后除以一个有限值,所述有限值是收集的数据中患肺癌并且相关基因表达多达18个的人数占总人数的概率,再将得到的值当做权值。
6.根据权利要求1所述的方法,其特征在于,用于分析蛋白质表达谱的次要神经网络中,先将病人蛋白质表达与否和是否患病关联起来,收集的有关蛋白质表达情况数目为36个,组成大小为【6,6】的数组,该数组只有0和1两个值,每一个数组对应一个患者,给该数组贴上标签是否患病;该神经网络只有一层卷积层,该层卷积层采用的是大小为【2,2】,步长为1,通道数为2的卷积核进行卷积;其输出层把卷积层的输出值经过softmax处理变成概率输出,然后除以一个有限值,所述有限值是收集的数据中患肺癌并且相关蛋白质表达多达
18个的人数占总人数的概率,再将得到的值当做权值。
7.根据权利要求1所述的方法,其特征在于,用于分析吸烟情况的次要神经网络中,先将病人是否有过戒烟,用1表示没有,0表示有;生活作息是否规律,1表示不规律,0表示规律;基因表达情况与蛋白质表达情况的和;加上环境等级,用这四个数据组成一个【2,2】的数组;该神经网络使用大小为【2,2】,步长为1,通道数为2的卷积核进行卷积;其输出层把卷积层的输出值经过softmax处理变成概率输出,然后除以一个有限值,所述有限值是收集的数据中患肺癌并且有吸烟的人数占总人数的概率,再将得到的值当做权值。
8.根据权利要求1所述的方法,其特征在于,用于分析工作环境的次要神经网络中,先将工作环境的优劣等级分为,0、1、2、3、4、5、6、7、8、9这十个等级;工作压力是否很大,1代表很大,0代表不大;空气污染等级;工作附近有无施工,1代表有,0代表无,将这四个数据组成【2,2】的数组;该神经网络将使用大小为【2,2】,步长为1,通道数为2的卷积核进行卷积;其输出层把卷积层的输出值经过softmax处理变成概率输出,然后除以一个有限值,所述有限值是收集的数据中患肺癌的人数占总人数的概率,再将得到的值当做权值。