1.一种基于改进免疫遗传算法的近红外光谱波长筛选方法,其特征在于,所述方法包括:
S1初始化种群:在种群中设置N个个体,作为抗体;将需筛选的近红外光谱波段均分为L个波段,每个波段包括多个波长点;每个波段对应抗体上的一个基因位,按照0‑1形式对抗体的基因进行随机编码;1表示选中该波段,0表示未选中该波段;
S2计算S1初始化的每个抗体的亲和度:对抗体的基因进行随机编码后,将选中的波段与对应的理化值进行PLS建模,得到校正集均方根误差RMSEC和相关系数R,根据校正集均方根误差RMSEC和相关系数R为变量计算每个抗体的亲和度;
S3初始化记忆细胞:另设M个个体,用于存放后续更新迭代过程中亲和度最高的抗体,作为记忆细胞进行存储;并且对其基因进行0‑1随机编码;
S4计算抗体相似度:计算S1初始化的各个抗体与其他抗体的相似程度;
S5自适应相似阈值并计算S1初始化的各个抗体的抗体浓度di:抗体浓度di指抗体相似个数ci和群体总个数N的比值;所述相似阈值为当抗体浓度标准差达到最大值时的相似度;
S6计算聚合适应度:将亲和度和抗体浓度融合成聚合适应度;
S7对亲和度最优个体的基因进行局部性探优,即随机改变亲和度最优个体的一个基因位,并且保证改变之后该个体的亲和度大于改变之前的亲和度;如果改变之后该个体的亲和度小于改变之前的亲和度,则恢复被改变的基因位,再随机重取一个基因位进行改变,直到改变之后该个体的亲和度大于改变之前的亲和度;所述亲和度最优个体为N个抗体中亲和度最高的抗体;
S8更新记忆细胞:重新计算N+M个抗体中每个抗体的亲和度,选取最高的M个个体作为记忆细胞,作为记忆细胞储存起来,记忆细胞中的抗体直接以概率为1复制到下一代种群中;
S9进行遗传操作:通过轮盘赌选择法进行基因的复制;
S10更新迭代:迭代次数达到K的时候,选取种群中亲和度最优个体作为最终候选个体;
最终候选个体中编码为1对应的波段作为最终筛选波段;
自适应相似阈值指的是阈值从种群中抗体相似度最小值遍历至最大值,当群体抗体浓度标准差达到最大时,即抗体浓度差异性最大时对应的抗体相似度作为最终自适应相似度阈值;
所述S6将亲和度和抗体浓度融合成聚合适应度包括:根据下式计算聚合适应度:
PZ=λZ+(1‑λ)exp(‑udi) (6)其中,λ,μ为分别反映亲和度和抗体浓度期望被选择到下一代的相对重要性的参数,λ取0.7,μ取1.25。
2.根据权利要求1所述的方法,其特征在于,所述S4采用海明距离作为抗体相似度的度量方法。
3.根据权利要求2所述的方法,其特征在于,所述抗体相似度的计算公式为:其中,Ab(pi,pj)表示抗体pi和pj的相似度,L为抗体的基因的编码长度;
f(pi,pj)表示抗体pi和pj之间的海明距离;
分别表示第i个抗体的第k位基因位和第j个抗体的第k位基因位; 即为中间变量。
4.根据权利要求3所述的方法,其特征在于,所述S2中亲和度计算公式为:
5.根据权利要求4所述的方法,其特征在于,所述S9包括:第i个抗体通过轮盘赌选择法进行基因的复制,被选择进行遗传复制操作的概率表示为Pi:
其中,PZi为第i个抗体对应的聚合适应度,PZj为第j个抗体对应的聚合适应度,N为种群大小;
通过单点交叉对种群各抗体进行交叉处理;所述单点交叉指交换两个抗体的部分基因值;设定交叉概率为Pc,设定变异概率Pm;对于0‑1基因链码,随机挑选c个基因位,以变异概率Pm对挑选的c个基因位上的值取反,即0变1,1变0。
6.根据权利要求5所述的方法,其特征在于,所述抗体浓度di的计算公式为:其中,ci表示第i个抗体对应的抗体相似个数,N表示群体总个数。
7.根据权利要求1所述的方法,其特征在于,所述需筛选的近红外光谱波段为采用马氏距离剔除异常数据后的光谱波段。
8.根据权利要求5所述的方法,其特征在于,设定交叉概率Pc取0.85,设定变异概率Pm取0.05。