1.基于自监督学习的图像分类方法,其特征是,包括:
获取待分类的无标签图像;对所有待分类的无标签图像进行预处理;
对所有待分类的无标签图像进行预处理;具体步骤包括:采用Otsu阈值分割法对所有待分类的无标签图像进行分割,将每一个待分类的无标签图像分割为背景图像和目标图像;
所述采用Otsu阈值分割法对所有待分类的无标签图像进行分割,将每一个待分类的无标签图像分割为背景图像和目标图像;具体步骤包括:将彩色图像转换为灰度图像;将灰度图像进行二值化处理,得到分割后的目标图像;
对预处理后的每一个无标签图像进行特征提取;每一个无标签图像均得到与之对应的特征;
对预处理后的每一个无标签图像进行特征提取;是指:对预处理后的每一个无标签图像,利用卷积受限玻尔兹曼机CRBM模型进行特征提取;
所述卷积受限玻尔兹曼机CRBM模型,选用三层的卷积受限玻尔兹曼机CRBM模型进行特征提取;
卷积受限玻尔兹曼机CRBM模型的能量函数为:
k
其中,“*”为卷积操作符,w表示第k个卷积核的权重, 表示第k个隐含层中的第i行第j个单元,vij表示可视层中第i行第j个单元,bk为第k个可视层到隐含层单元的偏置,c为隐含层到可视层单元的共享偏置;
基于能量函数的CRBM联合概率分布为:
其中,Z为归一化参数,CRBM同样采用层内无连接,层间全连接的方式构建而成,所以可视层与隐含层间的条件概率分布彼此独立;
可视层与隐含层的条件概率分布函数分别为:
k k
P(vij=1|h)=σ((∑kw*h)ij+c) (4);
从所有待分类的无标签图像中划分出一部分作为训练集;
对训练集中所有无标签图像的特征进行聚类处理;对训练集中所有无标签图像的特征进行聚类处理,是指:选用模糊C均值算法FCM,对训练集中所有无标签图像的特征进行聚类处理;
用模糊C均值算法将数据集中提取的特征聚为10类;给数据打上伪标签,根据聚类中心与隶属度的关系,将数据的特征向量分为10类,每一个特征的类别归属于自身隶属度与聚类中心最近的聚类中心所对应的类别,然后为聚类中心打上伪标签;
选用模糊C均值算法对提取的特征聚类,根据聚类中心与隶属度的关系确定预训练提取的特征的类别,并对每个类别中的特征打上对应的伪标签;
模糊C均值算法的目标函数表达式为:
uij∈[0,1],
i∈[1,C],j∈[1,N] (5)式(5)中:xj表示第j个样本点,vi表示第i个聚类中心,uij表示第j个样本点相对于第i个2
聚类中心的隶属度,‖xj‑vi‖表示第j个样本点与第i个聚类中心之间的距离,γ表示熵的正N×C d×C则化参数,隶属度矩阵U∈R 由uij组成,聚类中心矩阵V∈R 由vi组成;
根据拉格朗日法则,求解(5)式得到最优聚类中心V和隶属度U的迭代公式为:根据聚类结果确定每个特征所对应的类别,并对每个类别中的所有特征均打上对应的伪标签;特征的伪标签即为特征所对应无标签图像的伪标签;
所述对每个类别中的所有特征均打上对应的伪标签,是指:每一个特征的类别归属于自身隶属度与聚类中心最近的聚类中心所对应的类别;
基于训练集中每一个无标签图像所提取的特征和每一个无标签图像的伪标签,对预训练的神经网络进行再训练;得到再训练后的神经网络;
将所有待分类的无标签图像的特征均输入到优化训练后的神经网络中,输出每一个待分类的无标签图像的伪标签;
预训练的神经网络,是指预训练的神经网络VGG16,预训练的神经网络的训练步骤包括:将已知图像类别的ImageNet数据集,输入到神经网络VGG16中,对神经网络VGG16进行训练,得到预训练后的神经网络VGG16。
2.采用如权利要求1所述的基于自监督学习的图像分类方法的基于自监督学习的图像分类系统,其特征是,包括:预处理模块,其被配置为:获取待分类的无标签图像;对所有待分类的无标签图像进行预处理;
特征提取模块,其被配置为:对预处理后的每一个无标签图像进行特征提取;每一个无标签图像均得到与之对应的特征;
训练集划分模块,其被配置为:从所有待分类的无标签图像中划分出一部分作为训练集;
聚类处理模块,其被配置为:对训练集中所有无标签图像的特征进行聚类处理,根据聚类结果确定每个特征所对应的类别,并对每个类别中的所有特征均打上对应的伪标签;特征的伪标签即为特征所对应无标签图像的伪标签;
训练模块,其被配置为:基于训练集中每一个无标签图像所提取的特征和每一个无标签图像的伪标签,对预训练的神经网络进行再训练;得到再训练后的神经网络;
分类模块,其被配置为:将所有待分类的无标签图像的特征均输入到优化训练后的神经网络中,输出每一个待分类的无标签图像的伪标签;
对预处理后的每一个无标签图像进行特征提取;是指:对预处理后的每一个无标签图像,利用卷积受限玻尔兹曼机CRBM模型进行特征提取;
预训练的神经网络,是指预训练的神经网络VGG16,预训练的神经网络的训练步骤包括:将已知图像类别的ImageNet数据集,输入到神经网络VGG16中,对神经网络VGG16进行训练,得到预训练后的神经网络VGG16。
3.一种电子设备,其特征是,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成权利要求1所述的方法。
4.一种计算机可读存储介质,其特征是,用于存储计算机指令,所述计算机指令被处理器执行时,完成权利要求1所述的方法。