1.基于图像分析的宫颈癌细胞学筛查系统,包括图像获取模块、图像处理模块,其特征在于,还包括细胞标记模块、特征提取模块、对比分析模块、中心控制模块、识别检验模块、结果输出模块,其中;
所述图像获取模块用于对宫颈液基涂片进行扫描,获取宫颈液基涂片的涂片扫描图像;
所述图像处理模块与所述图像获取模块连接,用于对获取的涂片扫描图像进行预处理和分割,获取分割后涂片扫描图像的所有感兴趣区域,所述细胞标记模块与所述图像分割模块连接,用于根据分割后图像的感兴趣区域中含有的物质种类将获取的其中部分感兴趣区域分类为不同的标记样本;
所述特征提取模块与所述细胞标记模块连接,用于提取所述标记样本的特征参数;
所述对比分析模块与所述特征提取模块连接,用于根据标记样本的特征参数对未被所述细胞标记模块标记的感兴趣区域进行一一对比识别,根据识别结果将未标记的感兴趣区域分类;
所述识别检验模块与所述对比分析模块连接,用于对未标记的感兴趣区域分类结果进行检验,计算未标记感兴趣区域的分类准确率;
所述中心控制模块与所述识别检验模块连接,通过设置分类准确率输出阈值,用于区分未标记感兴趣区域分类准确率的等级,判定是否输出分类结果;
所述结果输出模块与所述中心控制模块连接,用于当所述中心控制模块判定为输出分类结果时,统计需要被输出分类结果的感兴趣区域数量,并输出数量统计结果及对应的感兴趣区域图像。
2.根据权利要求1所述的基于图像分析的宫颈癌细胞学筛查系统,其特征在于,所述筛查系统的筛查方法包括以下步骤:步骤一,采用薄层液基技术制备宫颈液基涂片,通过图像获取模块对宫颈液基涂片进行扫描,获取至少一组宫颈液基涂片的涂片扫描图像;
步骤二,通过图像处理模块对获取的涂片扫描图像进行增强处理,采用阈值分割法对获取的涂片扫描图像进行分割,算法模型为:其中,i,j分别表示像素的横纵坐标;g(i,j)表示像素的局部特性;f(i,j)表示像素灰度值;T为分割阈值;
通过对图像进行分割后,按照含有的物质种类提取分割后涂片扫描图像的所有感兴趣区域,包括正常细胞区域、病变细胞区域、杂质区域、正常细胞与病变细胞重合区域、正常细胞与杂质重合区域、病变细胞与杂质重合区域、正常细胞与病变细胞及杂质重合区域七类;
步骤三,将感兴趣区域按照类型依次编号为A1,A2,、、、,A7,分别选取涂片扫描图像中各类感兴趣区域的若干个区域作为样本,对选取的样本进行标记,获取标记样本,并将标记样本进行编号为Aij,其中,i为感兴趣区域类型编号,i=1,2,、、、,7;j为标记样本编号j=1,
2,、、、,n,n为正整数;
步骤四,根据自动识别宫颈癌细胞病理学改变的特征集,采用图像识别算法提取标记样本的密度特征、尺寸特征、边缘特征、形状特征、纹理特征的特征参数;
步骤五,分别获取未被标记的感兴趣区域的各项特征参数,构建未被标记感兴趣区域的评价数据组,记作Qt=(q1t,q2t,、、、,qlt),其中,t为未被标记的感兴趣区域的编号,t=1,
2,、、、,n,n为正整数,l为未被标记的感兴趣区域的特征参数的项数,l=1,2,、、、,u,u为正整数,以标记样本的特征参数均值作为对比数据组,记作P=(p1,p2,、、、,pl),计算评价数据组与对比数据的欧氏距离作为数据组的相似度Si,计算公式为:根据相似度将所有未标记的感兴趣区域进行分类;
步骤六,采用随机抽样法抽取未标记的感兴趣区域分类后的W个检验样本,对抽取的检验样本进行检验验证,根据验证结果计算各类未标记感兴趣区域的分类准确率Crv,计算公式为: 其中v表示未标记的感兴趣区域类型,v=1,2,、、、,7;Wv表示第v项未标记的感兴趣区域的检验样本总量;wv表示第v项未标记的感兴趣区域的检验样本正确项数量;
步骤七,对未标记感兴趣区域的分类准确率Crv的等级进行划分,根据输出阈值及区分结果判定是否输出分类结果;
步骤八,当所述中心控制模块判定为输出分类结果时,统计需要被输出分类结果的感兴趣区域数量,并输出数量统计结果及对应的感兴趣区域图像,当所述中心控制模块判定为不输出分类结果时,回到步骤六,重新抽取不输出的未标记的感兴趣区域的检验样本,再次进行分类准确率验证,若验证的结果仍判定为不输出分类结果时,回到步骤五。
3.根据权利要求1所述的基于图像分析的宫颈癌细胞学筛查系统,其特征在于,所述标记样本根据分割后图像的感兴趣区域中含有的物质种类被分类为正常细胞标记样本、病变细胞标记样本、杂质标记样本、正常细胞与病变细胞重合的标记样本、正常细胞与杂质重合的标记样本、病变细胞与杂质重合的标记样本、正常细胞与病变细胞及杂质重合的标记样本。
4.根据权利要求2所述的基于图像分析的宫颈癌细胞学筛查系统,其特征在于,在特征参数中,密度特征包括平均灰度、标准差、熵、目标‑背景对比度;
尺寸特征包括面积、周长、长径、宽径;
边缘特征包括边缘强度、边缘方差、边缘模糊系数;
形状特征包括凸度、圆形度、形状因子、偏心率、傅立叶描述子、平均标准化半径、标准化半径方差、标准化半径熵、面积比率、粗糙度;
纹理特征包括分形维数、灰度共生矩阵、局部二值模式均值、LBP方差。
5.根据权利要求2所述的基于图像分析的宫颈癌细胞学筛查系统,其特征在于,在步骤四,提取的标记样本的特征参数包括密度特征中的至少一种特征、尺寸特征中的至少一种特征、边缘特征中的至少一种特征、形状特征中的至少一种特征及纹理特征中的至少一种特征。
6.根据权利要求2所述的基于图像分析的宫颈癌细胞学筛查系统,其特征在于,在步骤七中,分类准确率Crv的等级划分方法为:获取分类准确率Crv后,利用分类准确率Crv的数值创建样本集,并获取样本集中的均值和标准差,利用均值和标准差对数据进行标准化,标准化公式为 在此式中z为标准参量,σ为样本数据的方差,μ为样本数据的均值,在完成标准化后,将标准参量利用将数值区间调整至[0,1]之间,利用f(k)的函数值对重合率进行分类,分类的机制为:
当 时,分类准确率Crv分类为一级;
当 时,分类准确率Crv分类为二级;
其中,f(k)min,f(k)max分别为f(k)的函数值的最小值和最大值。
7.根据权利要求2所述的基于图像分析的宫颈癌细胞学筛查系统,其特征在于,在步骤七中,判定是否输出分类结果的原则为:当分类准确率Crv分类为一级时,判定为不输出分类结果;
当分类准确率Crv分类为二级时,判定为输出分类结果。
8.根据权利要求1所述的基于图像分析的宫颈癌细胞学筛查系统,其特征在于,所述筛查系统还包括存储模块、处理器及存储在存储模块上并可在处理器上运行的计算机程序,所述存储模块与所述图像获取模块及所述结果输出模块连接,用于存储宫颈液基涂片的涂片扫描图像信息及需要被输出分类结果的感兴趣区域数量和图像信息,其中,处理器执行程序时能够实现权利要求2中任一项所述方法的步骤。
9.根据权利要求2所述的基于图像分析的宫颈癌细胞学筛查系统,其特征在于,在步骤
2中,分割阈值T的取值根据获取的宫颈液基涂片的涂片扫描图像质量由经验法进行确定。
10.根据权利要求2所述的基于图像分析的宫颈癌细胞学筛查系统,其特征在于,在步骤六中,采用随机抽样法抽取的未标记的感兴趣区域分类后的检验样本W的数量由公式:确定,其中,N为检验样本W的数量的数量;Zw为抽样调差置信度,通常取95%;Pw为抽样样本的离散程度;Ew为抽样误差范围,通常取±3%。