1.一种土壤重金属含量反演模型生成方法,其特征在于,包括如下步骤:步骤1:获取土壤样本的重金属含量及室内光谱数据;
步骤2:对土壤样本的室内光谱数据进行预处理并采用竞争性自适应重加权方法提取重金属光谱特征波段;
步骤3:基于土壤样本的重金属含量及与其对应的重金属光谱特征波段构建实测样本集;
步骤4:基于实测样本集中土壤样本的重金属含量及与其对应的重金属光谱特征波段,应用基于最小二乘虚拟样本生成方法生成土壤虚拟样本集,使土壤虚拟样本与实测样本数量之比为1~10:1,实测样本集与土壤虚拟样本集构成混合样本集;
步骤5:基于混合样本集,以重金属光谱特征波段为输入,对应重金属含量为输出,训练得到BP神经网络重金属含量反演回归模型。
2.根据权利要求1所述的土壤重金属含量反演模型生成方法,其特征在于,步骤2中所述对土壤样本的室内光谱数据进行预处理包括:对土壤样本的室内光谱数据进行光谱重采样:
以预设光谱长度为间隔单元,采用以下公式对土壤样本的室内光谱数据进行光谱重采样:r=[r(λ1)+…+r(λi)+…+r(λn)]/n其中,r表示高光谱曲线经过重采样后的反射率值,n为间隔单元范围内所包含的光谱波段数,r(λi)表示第i个光谱波段λi的反射率值;
对光谱重采样后得到的土壤样本的室内光谱数据进行分数阶微分预处理:基于分数阶微分采用以下公式计算光谱重采样后得到的各土壤样本的室内光谱数据:其中,r(λi)为第i个光谱波段λi的反射率值,rv(λi)为光谱波段λi的v阶微分光谱值,γ为Gamma函数,n为光谱波段数量, h为微分步长,t为微分上限,a为微分下限。
3.根据权利要求1或2所述的土壤重金属含量反演模型生成方法,其特征在于,步骤2中所述采用竞争性自适应重加权方法提取重金属光谱特征波段包括如下过程:用M表示蒙特卡洛仿真法采样次数,m表示室内光谱预处理后的土壤样本总数,n表示所测土壤样本的室内光谱数据中光谱波段的个数,i表示第i次采样,则竞争性自适应重加权方法包括如下步骤:
1)初始化i=1;
2)判断i≤M是否成立,若成立则进入步骤3);若不成立,则进入步骤7);
3)采用蒙特卡洛仿真法从室内光谱预处理后的样本集中随机抽取q个样本,用V1表示,然后基于V1数据构建偏最小二乘反演重金属含量回归模型,其中m*0.8≤q<m;
4)求偏最小二乘反演重金属含量回归模型中的回归系数向量B的绝对值,用Bi表示,求偏最小二乘反演重金属含量回归模型中各回归系数的权重值wj=Bij/sum(Bi),其中,Bij表示第i次采样第j个光谱波段对重金属含量的贡献度;用指数衰减函数去除权重值相对较小的光谱波段,计算保留光谱波段的比例ri=ae-ki,其中,e为自然对数函数的底数,a和k可用以下公式表示:a=(n/2)1/(M-1)
5)采用自适应重加权算法从筛选后的n×ri个光谱波段中选一个光谱波段的子集,用V2表示;
6)基于光谱波段子集V2计算出RMSECV值后,执行V1=V2,i=i+1,转到步骤2),其中RMSECV表示交互验证均方根误差;
7)M次采样结束,竞争性自适应重加权算法共获得M个光谱波段子集和对应的M个RMSECV值;
8)选择最小的RMSECV值所对应的光谱波段子集为最优光谱波段子集,即为采用竞争性自适应重加权方法提取得到的重金属光谱特征波段。
4.根据权利要求1所述的土壤重金属含量反演模型生成方法,其特征在于,步骤4中所述基于实测样本集中土壤样本的重金属含量及与其对应的重金属光谱特征波段,应用基于最小二乘虚拟样本生成方法生成虚拟样本集,具体包括如下步骤:
4.1、以实测样本集为初始训练集D(0),领域控制因子选取为δ,δ取值范围为[0.0001,
0.01],最大搜索次数为V,待生成土壤虚拟样本数量为R,初始化循环变量r=1;
4.2、基于初始训练集D(0),以重金属光谱特征波段为输入,对应重金属含量为输出,训练得到偏最小二乘反演重金属含量回归模型,通过留一验证法得到初始训练集D(0)的训练绝对误差为E(0),令E=E(0);
4.3、判断r≤R是否成立,若成立,进入步骤4.4,若否,跳转至步骤4.14;
(0) (0)
4.4、根据初始训练集D 中各样本训练误差高低对初始训练集D 中的样本从高到低进行排序,记为 其中,N为初始训练集D(0)中样本总个数,x表示重金属特征光谱波段,y表示对应的重金属含量,训练误差是重金属含量预测值 与实测值yn之间绝对差值;
4.5、初始化循环变量n=1;
4.6判断n≤N是否成立,若成立,进入步骤4.7;若否,令r=r+1,跳转至步骤4.3;
4.7、初始化化搜索次数v=1;
4.8、判断v≤V是否成立,若成立,进入步骤4.9;若否,跳转至步骤4.13;
4.9、随机生成样本 对应δ邻域内的土壤虚拟样本(x(r),y(r));
4.10、基于训练集D(r-1)∪(x(r),y(r)),以重金属光谱特征波段为输入,对应重金属含量(0)为输出,训练得到偏最小二乘反演重金属含量回归模型,再计算得到初始训练集D 的训练绝对误差为E(r);
4.11、如果E(r)
4.12、令v=v+1,跳转至步骤4.8;
4.13、令n=n+1,跳转至步骤4.6;
4.14、输出土壤虚拟样本数量为R的土壤虚拟样本集。
5.根据权利要求4所述的土壤重金属含量反演模型生成方法,其特征在于,步骤4.9所述随机生成样本 对应δ邻域内的土壤虚拟样本(x(r),y(r))包括如下过程:确定样本 对应δ邻域范围:对于第m个重金属光谱特征波段Λm而言,土壤虚拟样本的取值范围为 其中,
表示原始训练集D(0)第m个重金属光谱特征波段Λm的范围;
对于重金属含量y而言,土壤虚拟样本的取值范围为 其中,L(0)表示原始训练集D(0)重金属含
量y的范围;
在样本 对应δ邻域范围内随机生成土壤虚拟样本(x(r),y(r))。
6.根据权利要求1所述的土壤重金属含量反演模型生成方法,其特征在于,步骤5所述基于混合样本集,以重金属光谱特征波段为输入,对应重金属含量为输出,训练得到BP神经网络重金属含量反演回归模型,具体包括如下步骤:
5.1、确定BP神经网络重金属含量反演回归模型的输入和输出,输入为混合样本集的重金属光谱特征波段,输出对应的重金属含量;
5.2、建立n个输入、1个输出的三层前向神经网络拓扑结构,隐含层和输出层的激活函数采用Sigmod型函数,层与层之间采用全互连方式连接,同一层结点之间无连接,其中n为重金属光谱特征波段个数;
5.3、用BP算法对BP神经网络重金属含量反演回归模型进行学习训练,直到满足预设训练精度,即建立了BP神经网络重金属含量反演回归模型。
7.根据权利要求1所述的土壤重金属含量反演模型生成方法,其特征在于,步骤1所述获取土壤样本的重金属含量及室内光谱数据包括如下过程:根据研究区土壤类型、质地和覆盖作物类型,在研究区范围内均匀的、随机选取不少于
30个土壤样本,在实验室内对采集到的土壤样本采用三酸消化—原子吸收分光光度法化学分析测定土壤样本中重金属含量,同时,采用AvaFiled-3型全波段地物光谱辐射仪进行土壤光谱测定得到室内光谱数据。
8.一种土壤重金属含量反演模型生成系统,其特征在于,包括:数据获取模块:用于获取土壤样本的重金属含量及室内光谱数据;
特征提取模块:用于对土壤样本的室内光谱数据进行预处理并采用竞争性自适应重加权方法提取重金属光谱特征波段;
虚拟样本生成模块:用于基于土壤样本的重金属含量及与其对应的重金属光谱特征波段构建的实测样本集,应用基于最小二乘虚拟样本生成方法生成土壤虚拟样本集,使土壤虚拟样本与实测样本数量之比为1~10:1;
反演模型生成模块:用于基于实测样本集与土壤虚拟样本集构成的混合样本集,以重金属光谱特征波段为输入,对应重金属含量为输出,训练得到BP神经网络重金属含量反演回归模型。
9.一种计算机可读存储介质,其特征在于,所述存储介质包括存储的程序指令,所述程序指令适于处理器加载并执行如权利要求1至7任一项所述的土壤重金属含量反演模型生成方法。
10.一种土壤重金属含量反演方法,其特征在于,包括如下步骤:获取待测土壤样本的室内光谱数据;
对待测土壤样本的室内光谱数据进行预处理并采用竞争性自适应重加权方法提取重金属光谱特征波段;
将提取的重金属光谱特征波段作为BP神经网络重金属含量反演回归模型的输入,输出对应的重金属含量,其中,所述BP神经网络重金属含量反演回归模型采用如权利要求1至8任一项所述的方法生成。