1.一种基于协方差矩阵的主动学习方法,其特征在于:包括。
采集脱丁烷塔生产过程的丁烷浓度值,并将丁烷浓度值作软测量建模样本;
将软测量建模样分为训练集和测试集,其训练集划分为有标签样本集和无标签样本集;
利用有标签样本集建立高斯过程回归模型,并确定模型初参数;
根据无标签样本集,选出构成协方差矩阵行列式值最大的样本;
重新建立高斯过程回归模型,确定模型参数;
利用测试集对丁烷浓度进行预测。
2.如权利要求1所述的基于协方差矩阵的主动学习方法,其特征在于:所述训练集的有标签样本集和无标签样本集分别为 和其中,nl和nu分别为有标记样本和无标记样本个数,n为辅助变量个数。
3.如权利要求2所述的基于协方差矩阵的主动学习方法,其特征在于:所述高斯过程回归模型采用高斯协方差函数;
其中,高斯协方差函数公式如下:
2
其中,l为方差尺度,σf为信号方差,Xi和Xj表示为输入变量,δij表示为噪声标准差,i=j,dij=1否则dij=0。
4.如权利要求3所述的基于协方差矩阵的主动学习方法,其特征在于:所述高斯过程回归模型的超参数为θ={σf2,l2};
其中,最优超参数采用极大似然估计和共轭梯度下降法获得。
5.如权利要求4所述的基于协方差矩阵的主动学习方法,其特征在于:所述高斯过程回归模型的均值和方差通过式(2)得到:其中,K(X*,X*)为待测样本自身协方差矩阵,K(X,X*)为待测样本与标记样本的协方差矩阵,K(X,X)为标记样本自身协方差矩阵。
*
6.如权利要求5所述的基于协方差矩阵的主动学习方法,其特征在于:若X 为多个无标签样本的集合,则D(f*|X,y)为无标签样本构成的协方差矩阵,记为cov(f*|X,y)。
7.如权利要求5或6所述的基于协方差矩阵的主动学习方法,其特征在于:根据无标签样本集,选出构成协方差矩阵行列式值最大的样本的步骤包括:每次对挑选m个无标签样本进行标记;
通过m个样本使其构成协方差矩阵行列式值达到最大。
8.如权利要求7所述的基于协方差矩阵的主动学习方法,其特征在于:无标样本的协方差矩阵由式(2)构建;
其中,其根据行列式的值衡量样本间的相似性。
9.如权利要求8所述的基于协方差矩阵的主动学习方法,其特征在于:所述重新建立高斯过程回归模型,确定模型参数:对挑选出的m个无标签样本进行人工标记,标记后加入有标签样本集;
更新有标签样本集,重新建立高斯过程回归模型;
重新确定模型参数。
10.如权利要求8或9所述的基于协方差矩阵的主动学习方法,其特征在于:挑选m个无标签样本的步骤如下:从N个无标签样本选取前m个样本,根据公式(1),通过有标签样本集建立的GPR模型确定的模型参数,并计算这m个无标签样本的协方差矩阵行列式值;
剩余的无标签样本依次替代m个无标签样本中的第1个样本,替换次数为剩余无标签样本个数,计算替换后的协方差矩阵行列式值;
设第a个样本替换第1个样本后,协方差矩阵行列式值最大,则以第a个样本替换第1个无标签样本,其无标签样本集则除去第a个样本;
按上述流程依次替换直至使行列式值最大的样本z替换第m个样本,完成m个样本的全部替换;
对m个无标签样本集进行人工标记,标记后加入有标签样本集更新高斯过程回归模型。