1.一种基于粒子群算法的深度卷积神经网络架构搜索方法,其特征在于:具体包括以下步骤:S101:构建基于结构块的卷积神经网络架构;
S102:构建形状为(2,8,2)的三维数组,将所述卷积神经网络架构编码为粒子;
S103:根据粒子在图像验证集上的分类精度计算粒子的适应值,得到粒子个体历史最优解pBest和粒子种群历史最优解gBest;
S104:根据粒子个体历史最优解pBest和粒子种群历史最优解gBest,更新粒子群,并判断是否达到终止条件,若是,则得到最优的卷积神经网络架构,否则跳转至步骤S103。
2.如权利要求1所述的基于粒子群算法的深度卷积神经网络架构搜索方法,其特征在于:所述基于结构块的卷积神经网络架构,由三个块组成,包括两个正常块和一个降维块。
3.如权利要求2所述的基于粒子群算法的深度卷积神经网络架构搜索方法,其特征在于:每个块由两个输入节点、四个中间节点、一个输出节点的有序序列组成。
4.如权利要求3所述的基于粒子群算法的深度卷积神经网络架构搜索方法,其特征在于:所述两个输入节点的输入分别为当前块的前一个块、前二个块输出节点的输出;
每个中间节点的输出由该中间节点之前的任意两个节点经过运算之和的输出;
所述输出节点的输出为四个中间节点的级联输出。
5.如权利要求4所述的基于粒子群算法的深度卷积神经网络架构搜索方法,其特征在于:步骤S102中,所述形状为(2,8,2)的三维数组,具体含义为:三维数组的第一维,表示2种块,分别为正常块和降维块;
三维数组的第二维,表示每个块中,四个中间节点对应的8个元素,每个元素在数组中具有索引;
每个所述元素,由对应中间节点输出过程中运算节点和运算节点之间的运算类型共同构成;所述运算类型存放于运算操作OP列表中。
三维数组的第三维,表示运算类型在OP列表中的索引和对应的运算节点。
6.如权利要求5所述的基于粒子群算法的深度卷积神经网络架构搜索方法,其特征在于:步骤S104更新粒子群时,策略为基于粒子中的元素更新,其具体为:将粒子的更新转化为对粒子中的元素进行逐个更新;
逐个求解两个粒子的元素E1与E2之差(E1-E2);
逐个求待更新元素的速度;
粒子中所有元素基于元素之差和给定元素速度逐个完成更新,最终达到粒子更新。
7.如权利要求6所述的基于粒子群算法的深度卷积神经网络架构搜索方法,其特征在于:所述两个粒子的元素E1与E2之差,具体为,如果元素E1、E2相同,则元素之差为None,表示两个元素没有差异,否则元素之差为E1。
8.如权利要求7所述的基于粒子群算法的深度卷积神经网络架构搜索方法,其特征在于:所述给定元素速度,其计算过程具体为:根据[0,1)之间的随机数r与预设的常数因子cg之间的大小关系,从给定元素P_E与粒子个体历史最优解pBest和粒子种群历史最优解gBest相同索引的的元素之差(gBest_E-P_E)和(pBest_E-P_E)中选择;
若[0,1)之间的随机数r小于等于预设的常数因子cg,则给定元素P_E的速度为(gBest_E-P_E);否则,元素P的速度为(pBest_E-P_E)。
9.如权利要求8所述的基于粒子群算法的深度卷积神经网络架构搜索方法,其特征在于:粒子中所有元素基于元素之差和给定元素速度逐个完成更新,最终达到粒子更新,具体过程为:S201:对于任一粒子P,逐个求解P与粒子个体历史最优解pBest和粒子种群历史最优解gBest相同索引的元素之差,分别为(gBest_E-P_E)和(pBest_E-P_E);
S202:根据[0,1)之间的随机数r与预设的常数因子cg之间的大小关系,得到待更新元素P_E的速度;
若[0,1)之间的随机数r小于等于预设的常数因子cg,则给定元素P_E的速度为(gBest_E-P_E);否则,为(pBest_E-P_E);
S203:根据待更新元素P_E的速度,对元素P_E进行更新,如果其速度为None,则元素P_E保持不变,否则用其速度将其替换。