知嘟嘟-专利交易平台_专利购买_专利出售-买专利,上嘟嘟

欢迎来到知嘟嘟！联系电话：13095918853 卖家免费入驻，海量在线求购！卖家免费入驻，海量在线求购！

嘟嘟会员

帮助中心网站地图

查出售查高校查求购查年费

我要发布

首页转移热力图Hot 专利交易委托购买高校专区科技服务专利求购年费查询行业资讯

联系电话：13095918853

知嘟嘟经纪人

一种基于卷积神经网络的艺术图像分类方法

￥57500

专利号： 2019106616433

申请人：浙江理工大学

专利类型：发明专利

专利状态：已下证

专利领域：计算；推算；计数

更新日期：2024-11-06

缴费截止日期：暂无

价格&联系人

年费信息

委托购买

专利简介

专利详情

委托购买说明

需准备材料

常见问题

摘要:

权利要求书:

1.一种基于卷积神经网络的艺术图像分类方法，包括如下步骤：

(1)获取大量各类艺术图像，由专业人员对这些图像进行清洗和筛查，并人工为每张图像打上类别标签；

(2)对每张图像进行预处理，从而得到对应的图像数据样本；

(3)将所有样本分为训练集和验证集，搭建卷积神经网络并利用训练集样本对该卷积神经网络进行训练，得到用于艺术图像分类的网络模型；

(4)将待分类的艺术图像经预处理后输入所述网络模型中，即可得到该艺术图像的分类结果。

2.根据权利要求1所述的艺术图像分类方法，其特征在于：所述步骤(1)中使用网络爬虫技术从艺术网站下载大量各类艺术图像，对于获取到的任一张图像，由专业人员裁剪掉图像中与艺术风格不相关的边框，并根据图像的艺术风格对其打上类别标签，在打标签的过程中对于不相关的类别图像进行筛除。

3.根据权利要求1所述的艺术图像分类方法，其特征在于：所述步骤(2)中对于低分辨率的图像，直接将其压缩至m×m大小，进而基于RGB三通道像素值得到m×m×3大小的图像数据样本；对于高分辨率的图像，以m个像素点为步长将整个图像划分成多个m×m大小的图块；对于每一图块，基于RGB三通道像素值得到其对应m×m×3大小的图像数据样本，m为大于48的自然数。

4.根据权利要求1所述的艺术图像分类方法，其特征在于：所述步骤(3)中的卷积神经网络从输入到输出由输入层、空洞卷积层、深度卷积层、3个深度可分离卷积层DS1～DS3、双核压缩激活层DKSE1、2个深度可分离卷积层DS4～DS5、双核压缩激活层DKSE2、2个深度可分离卷积层DS6～DS7、双核压缩激活层DKSE3、2个深度可分离卷积层DS8～DS9、全局平均池化层P以及全连接层依次连接组成。

5.根据权利要求4所述的艺术图像分类方法，其特征在于：所述输入层为m×m×3大小的图像数据样本；所述空洞卷积层使用32个3×3×3大小的卷积核，步长为1，膨胀率为2；所述深度卷积层使用32个3×3大小的卷积核，步长为3；所述全局平均池化层P将深度可分离卷积层DS9输出特征图的空间信息压缩到1024个通道描述符中；所述全连接层使用n个节点作为输出，采用的激活函数为Softmax，n为艺术图像类别数。

6.根据权利要求4所述的艺术图像分类方法，其特征在于：所述深度可分离卷积层DS1～DS9均包含深度卷积和逐点卷积两个子层；其中：深度可分离卷积层DS1的深度卷积子层使用32个3×3大小的卷积核，逐点卷积子层使用64个1×1×32大小的卷积核，步长均为1；

深度可分离卷积层DS2的深度卷积子层使用64个3×3大小的卷积核，步长为2，逐点卷积子层使用128个1×1×64大小的卷积核，步长为1；深度可分离卷积层DS3的深度卷积子层使用

128个3×3大小的卷积核，逐点卷积子层使用128个1×1×128大小的卷积核，步长均为1；深度可分离卷积层DS4的深度卷积子层使用128个3×3大小的卷积核，步长为2，逐点卷积子层使用256个1×1×128大小的卷积核，步长为1；深度可分离卷积层DS5的深度卷积子层使用

256个3×3大小的卷积核，逐点卷积子层使用256个1×1×256大小的卷积核，步长均为1；深度可分离卷积层DS6的深度卷积子层使用256个3×3大小的卷积核，步长为2，逐点卷积子层使用512个1×1×256大小的卷积核，步长为1；深度可分离卷积层DS7的深度卷积子层使用

512个3×3大小的卷积核，逐点卷积子层使用512个1×1×512大小的卷积核，步长均为1；深度可分离卷积层DS8的深度卷积子层使用512个3×3大小的卷积核，步长为2，逐点卷积子层使用1024个1×1×512大小的卷积核，步长为1；深度可分离卷积层DS9的深度卷积子层使用

1024个3×3大小的卷积核，逐点卷积子层使用1024个1×1×1024大小的卷积核，步长均为

1。

7.根据权利要求4所述的艺术图像分类方法，其特征在于：所述双核压缩激活层DKSE1～DKSE3均包含四个卷积层C1～C4、全局平均池化层P1以及特征重标定层；其中：双核压缩激活层DKSE1中的卷积层C1使用128个1×1×128大小的卷积核，卷积层C2使用128个5×5×

128大小的卷积核，步长均为1，双核压缩激活层DKSE1的输入分别经卷积层C1和C2各自的卷积核、批标准化和ReLU函数并行处理，进而对卷积层C1和C2处理后得到的特征图进行特征融合，全局平均池化层P1将融合后的特征图空间信息压缩到128个通道描述符中并依次经由卷积层C3和C4进行处理，卷积层C3使用128/r个1×1大小的卷积核、批标准化和ReLU函数进行卷积操作，卷积层C4使用128个1×1大小的卷积核和Sigmoid函数进行特征归一化处理，特征重标定层将归一化的特征分别加权映射到并行卷积层C1和C2输出的特征图上，并将加权映射后的特征图进行特征融合后输出，r为特征图通道降维比例；

双核压缩激活层DKSE2中的卷积层C1使用256个1×1×256大小的卷积核，卷积层C2使用256个5×5×256大小的卷积核，步长均为1，双核压缩激活层DKSE2的输入分别经卷积层C1和C2各自的卷积核、批标准化和ReLU函数并行处理，进而对卷积层C1和C2处理后得到的特征图进行特征融合，全局平均池化层P1将融合后的特征图空间信息压缩到256个通道描述符中并依次经由卷积层C3和C4进行处理，卷积层C3使用256/r个1×1大小的卷积核、批标准化和ReLU函数进行卷积操作，卷积层C4使用256个1×1大小的卷积核和Sigmoid函数进行特征归一化处理，特征重标定层将归一化的特征分别加权映射到并行卷积层C1和C2输出的特征图上，并将加权映射后的特征图进行特征融合后输出；

双核压缩激活层DKSE3中的卷积层C1使用512个1×1×512大小的卷积核，卷积层C2使用512个5×5×512大小的卷积核，步长均为1，双核压缩激活层DKSE3的输入分别经卷积层C1和C2各自的卷积核、批标准化和ReLU函数并行处理，进而对卷积层C1和C2处理后得到的特征图进行特征融合，全局平均池化层P1将融合后的特征图空间信息压缩到512个通道描述符中并依次经由卷积层C3和C4进行处理，卷积层C3使用512/r个1×1大小的卷积核、批标准化和ReLU函数进行卷积操作，卷积层C4使用512个1×1大小的卷积核和Sigmoid函数进行特征归一化处理，特征重标定层将归一化的特征分别加权映射到并行卷积层C1和C2输出的特征图上，并将加权映射后的特征图进行特征融合后输出。

8.根据权利要求6所述的艺术图像分类方法，其特征在于：所述空洞卷积层、深度卷积层、深度卷积子层、逐点卷积子层的输出均依次经批标准化和ReLu函数处理。

9.根据权利要求1所述的艺术图像分类方法，其特征在于：所述步骤(3)中对卷积神经网络进行训练过程中采用交叉熵损失函数和Adam优化器通过正向传播和反向传播的方式按批次对网络进行训练。

10.根据权利要求1所述的艺术图像分类方法，其特征在于：所述步骤(3)中当卷积神经网络训练完成后，利用验证集样本对其进行验证以及参数微调，从而最终确立用于艺术图像分类的网络模型。