1.一种基于Laplacian算子的特征选择方法,其特征在于,具体步骤如下:步骤一、建立Lasso特征选择方法优化的目标函数:T N×d
其中,X表示给定训练样本集:X=[x1,x2,…,xN] ∈R ,xi表示第i个样本的特征向量,N表示训练样本个数,d表示特征维数;Y表示样本所对应的相应向量:Y=[y1,y2,…N,yN]∈R,yi表示样本的类标签,且yi∈{+1,-1};w表示特征向量的回归系数;λ>0表示一个正则化参数,用于平衡模型复杂度和数据拟合程度;
步骤二、在步骤一的Lasso目标函数中引入一个正则化项:其中,S=[Sij]表示一个相似矩阵,定义了两个样本之间相似性;xi和xj分别表示两个样本;L=D-S表示Laplacian矩阵,D表示对角矩阵,且根据所引入的正则化项,采用基于Laplacian算子的特征选择方法,构建Lap-Lasso目标函数模型,其表达如下:其中,λ和β是两个大于0的常数;
步骤三、求解上述Lap-Lasso目标函数模型,其中,Lasso稀疏化项使得少量的特征能被选择,而Laplacian正则化项保留同类标签样本的局部相邻结构信息,实现帮助诱导出更有判别力的特征。
2.如权利要求1所述的一种基于Laplacian算子的特征选择方法,其特征在于,采用APG算法优化Lap-Lasso目标函数模型:
201、将Lap-Lasso目标函数模型划分成两部分,分别是:平滑部分:
非平滑部分:g(w)=C‖w‖1;
202、构建函数用以近似表示f(w)+g(w):其中, 表示第k次迭代点wk的梯度,l表示步长;
203、对APG算法进行更新:
其中,
3.如权利要求2所述的一种基于Laplacian算子的特征选择方法,其特征在于,步骤
203中,所述对APG算法更新计算的方法是:将更新计算问题分解成d个独立的子问题,所述子问题的解析解为:
4.如权利要求1或3所述的一种基于Laplacian算子的特征选择方法,其特征在于:步骤二中,参数λ和β的值的计算方法是:将训练数据通过交叉验证来确定。
5.如权利要求4所述的一种基于Laplacian算子的特征选择方法,其特征在于:所述相似矩阵S用以保存映射时同类样本的局部相邻结构信息。