1.基于偏最小二乘的高斯过程回归废水出水指标预测方法,其特征在于,所述方法采用偏最小二乘完成对被测变量个数的小范围选取,所述被测变量为废水的进水化学需氧量COD、出水化学需氧量、进水悬浮固形物SS、出水悬浮固形物;溶解氧DO、流量Q、温度T、pH值;
使变量降低维度的同时与主导变量具备更高的相关性,再结合不同协方差函数构建高斯过程回归模型,以此提供不同模型的对比实现最优预测;实现对出水化学需氧量、出水悬浮固形物的在线预测;
该方法包括以下步骤:
n×m
S1.数据预处理:首先选择训练样本输入数据X∈R ,n代表样本个数,m代表样本维数,n×p
其次选择训练样本输出数据Y∈R ,p代表样本维数,最后完成对输入数据和输出数据的标准化处理;所述输入数据为所述被测变量的实测数值,所述输出数据为出水化学需氧量、出水悬浮固形物;
S2.PLS模型的构建:对输入数据X和输出数据Y进行PLS分解,选取合适的潜变量以完成n×d
得分矩阵T∈R ,d为潜变量个数的筛选,筛选后的得分矩阵作为软测量模型的输入进行数据预测;
S3.建立所述得分矩阵T与输出数据Y之间的高斯过程回归模型:通过不同协方差函数的选取与组合构建不同的高斯过程回归模型;步骤S3包括:S31:求取高斯过程回归的预测值为:其中
T
X为训练集的输入,X*为测试集的输入;K(X,X*)=K(X*,X) 代表着训练集X与测试集X*样本点间的协方差矩阵,K(X*,X*)为测试集X*样本自身的协方差;In为n维单位矩阵;y为观测目标值;σ为高斯白噪声;
S32:通过不同协方差函数构建高斯过程回归模型;
S33:采用累加的方式进行协方差函数的组合;所述协方差函数包括平方指数协方差函数SE、线性协方差函数L、周期性协方差函数P;
采用平方指数协方差函数SE构建的高斯过程回归模型为:2
式中,M=diag(l),l为线性协方差函数的超参数, 为信号方差,参数的集合θ={l,σf}为超参数;
采用线性协方差函数L构建的高斯过程回归模型为:T ‑1
kL(x,x')=xM x' (12)2
同平方指数协方差函数,M=diag(l),l为线性协方差函数的超参数;
采用周期性协方差函数P构建的高斯过程回归模型为:kP(x,x')=k0(u(x),u(x')) (13)式中k0为任意随机核函数,周期性协方差函数将一维输入变量映射到二维u(x)空间,从而得到关于x的周期性随机函数:若k0=kSE(x,x'),则kP(x,x')转化为:这里kP(x,x')的超参数集合表示为θ={p,l,σf};
S34:超参数的获取:
超参数的集合通过最大似然法求得:其中 令式(16)对超参数θ求偏导,采用共轭梯度法得到超参数的最优解;获得超参数后,利用式(9)和(10)对测试集X*对应的预测值f*和预测方差 进行计算;S4.完成对不同软测量模型预测能力的评估:将测试集输入数据带入模型进行预测,根2
据输出数据的预测值与真实值计算出不同模型对应的均方根误差RMSE与决定系数R ,并做出对比选择最佳预测模型。
2.根据权利要求1所述的基于偏最小二乘的高斯过程回归废水出水指标预测方法,其特征在于,步骤S2中,偏最小二乘模型对输入数据X和输出数据Y分解如下:n×d m×d p×d
式中T∈R 为得分矩阵;P∈R 和Q∈R 分别为X和Y的负载矩阵;E和F分别为X和Y的残差矩阵,d为PLS潜变量的个数;求解PLS模型的典型算法为非线性迭代最小二乘法。
3.根据权利要求1所述的基于偏最小二乘的高斯过程回归废水出水指标预测方法,其特征在于,步骤S4包括:
S41:根据输出数据的预测值与真实值计算出不同模型对应的均方根误差RMSE:式中, 是估计值,yi是测量值,n为样本数;
2
S42:根据输出数据的预测值与真实值计算出不同模型对应的决定系数R:式中:
SSres代表残差平方和,SStot代表总变异平方和,是平均值。
4.根据权利要求3所述的基于偏最小二乘的高斯过程回归废水出水指标预测方法,其2
特征在于,所述RMSE值越接近于0,代表该模型预测实验数据具有越高的精确度;R 的结果2
在0到1之间,R越接近1,拟合程度越高。