1.基于认知信息粒子的半监督主动识别方法,其特征在于,通过训练DNN深度模型,DNN深度模型使用少量目标敏感样本,逐步训练智能识别系统来识别或检查工作领域中的对象,所述工作领域指医疗系统中的病态症状识别或工业现场中的产品缺陷检查,将目标敏感样本添加到训练数据集以微调深度模型,微调过程循环执行,逐步提高深度模型的识别准确率,通过逐步地微调DNN深度模型,最终给出样本识别确定结果;包括以下步骤:步骤S1、输入原始图像,训练初始深度模型;
步骤S11、使用训练数据集训练初始深度模型,所述训练数据集为小数据集,训练初始深度模型时,采用丢弃法进行训练,有效避免过拟合;
步骤S12、对深度模型计算自信心指数从而确定模型对样本的确信度,根据深度模型判断识别结果是否确信,若确信,则输出确定识别结果;否则,执行步骤S13;
步骤S13、深度模型请求专家分析数据和模型的不确定性,并给出不确定样本的指导信息,添加指导信息到专家指导样本集;
步骤S2、选择有效的训练样本:对专家指导样本集中的不确定样本计算深度模型的认知误差信息,并综合考虑各认知误差信息获得样本的认知信息粒子信息,选择CIPS值较大的样本作为目标敏感样本,结合模型的状态和样本集的大小确定欲选择的敏感样本的数量,进而选择有效的训练样本;
所述步骤S2中,获得样本的认知信息粒子信息具体包括以下步骤:步骤S21、计算预测认知误差XPE:针对专家的分类结果和模型在类别上的预测结果计算深度模型的预测认知误差: 其中 为专家给定的类别标签,X为输入样本, 是模型针对该类别的预测结果;
步骤S22、计算预测认知误差变化信息HVP:通过深度模型对不确定样本进行多次随机预测,得到模型针对该类别的多个不同预测结果,计算出多个预测认知误差及其在不同次预测的变化率,并利用信息熵来表达变化信息的大小:其中,T为同一样本不同随机输出次数,VPi为第i次预测后预测误差的变化:即第i次的预测误差 和第(i‑1)次的预测误差 之间的差异;
步骤S23、计算不同类别间预测认知误差变化信息HVC:通过深度模型对该样本进行预测获得模型对多个类别的预测误差,进行多次随机预测,得到针对不同类别的多个不同预测结果,计算其针对不同类别、不同预测结果的认知误差,并计算其相应信息熵的均值来表征模型针对该样本在不同类别间的认知误差信息;
步骤S24、计算样本的认知信息粒子βX:将专家对该样本的指导信息作为约束参数,综合考虑步骤S21中计算得到的预测认知误差XPE,预测认知误差变化信息HPV,不同类别件预测认知误差变化信息HVC,得到最终的样本认知信息粒子 其中T是同一样本不同随机输出次数,α是来自专家的关于该样本重要性指导信息,用来作为特征约束参数,符号 表示相关认知误差之间的混合融合操作。
2.根据权利要求1所述的基于认知信息粒子的半监督主动识别方法,其特征在于:所述步骤S22中,深度模型对样本进行多次随机预测采用随机正则化技术,从而得到多次随机输出,在深度模型每层后采用丢弃法来获得模型的预测输出概率P(y|x),其中y为专家给定的类别标签,x为输入样本。
3.根据权利要求1所述的基于认知信息粒子的半监督主动识别方法,其特征在于:所述步骤S23中,针对不同类别间预测认知误差变化信息HVC,使用平均信息熵的方法来获得,表示为 其中,C是类标签的数量,ykl是输入样本X在第k类上第l次随机输出预测值。
4.根据权利要求1所述的基于认知信息粒子的半监督主动识别方法,其特征在于:所述步骤S2中,选择目标敏感样本时通过计算每个样本的认知信息粒子获得认知特征域Tm,所述目标敏感样本为认知信息粒子值较大的样本。