1.一种基于弱监督学习的App图像内容安全检测方法,其特征在于,其包括以下步骤:
S1、首先对部分数据进行预处理,进而采用K‑Means聚类算法对数据进行训练,K‑Means算法将给定的数据集,按照样本之间的距离大小,将样本划分为K个数据簇,让簇内的点紧密相连,而让组间的距离拉大,将簇划分为(C1,C2,...Ck),最小化平方误差E为:其中,μi是簇Ci的均值向量,x为样本点的坐标,k为数据簇的个数;
S2、训练完成之后会生成权重文件,然后将其余数据输出送入Inception,通过Inception再与Resnet的输出相拼接,从而构成检测器,所述检测器以神经网络为基础框架,通过组合其中的神经元以达到输出要求,单个神经元的表达式为:其中, 为上一级神经元的输入, 为本级神经元的输出, 代表各个神经元连接的权重, 为偏置单元,用以修正输出,模型最终权重通过反向传播训练所获得;
所述检测器的使用步骤如下:
S21、采集用于训练检测器模型的数据,原始数据用数组的方式进行存储;
S22、对采集到的数据进行贴标签处理,一张图片对应着一个标签,标签采用one‑hot格式,以方便计算机进行处理;
S23、采用弱监督学习的方式,对部分图片进行处理,将处理过的数据放入模型中进行多次训练,采用Adam作为函数优化器,初步迭代500次,判断模型是否收敛,若收敛则根据模型损失来挑选出最优模型参数进行保存,用于之后的App图片检测,若不收敛,则继续进行迭代;
S24、App端收集需要进行检测的图片,将图片传输到模型中进行检测,如果图片内容符合要求,则检测结束,如果图片不符合要求,则对App发出修改信息。
2.根据权利要求1所述的基于弱监督学习的App图像内容安全检测方法,其特征在于,所示检测器采用卷积神经网络框架,使用卷积层,采用的局部连接和权值共享的方式,减少权值的数量。
3.根据权利要求1所述的基于弱监督学习的App图像内容安全检测方法,其特征在于,收集含有违法信息的图片,并进行打包处理,若为单一类别检测模式,则将每个类别区分开来,然后将每个类别中的50%的数据进行贴标签处理;若为多类别检测模式,则将所有的图片均匀混合,然后将所有数据的50%进行贴标签处理。
4.根据权利要求1所述的基于弱监督学习的App图像内容安全检测方法,其特征在于,所收集的图片中,50%的图片用Python中特有的库进行精准标注,其余图片利用K‑Means算法进行聚类标注。
5.根据权利要求1所述的基于弱监督学习的App图像内容安全检测方法,其特征在于,采用弱监督学习方法以减少数据标签的依赖性,降低前期的准备工作,整个算法的流程近似残差结构,使神经网络学习数据处理和未处理之间的差异,更好地检测出特征。
6.根据权利要求1所述的基于弱监督学习的App图像内容安全检测方法,其特征在于,模型的backbone部分采用Resnet,使得学习结果堆网络权重的波动变化更加敏感,同时残差结果对数据的波动更加敏感,在算法部分加入Inception结构,其结构能控制计算量和参数,获得良好的分类。
7.根据权利要求1所述的基于弱监督学习的App图像内容安全检测方法,其特征在于,训练App内容检测器的过程为:首先分别将精准标注的数据集和用K‑Means算法标注的数据集并行地整合成一个Image batch,然后将这批数据送入到以卷积神经网络为核心的backbone中,采用的backbone为Resnet。