1.一种无监督正则化矩阵分解特征选择方法,包括以下步骤:
1)输入样本数据矩阵X∈Rn×m;其中,n表示样本总数,m表示数据的特征维数;
2)构建基于非负矩阵分解模型用于特性选择:其中,Ik×k是大小为k×k的单位矩阵,H∈Rk×m是系数矩阵,它将原始特征投影到被选特征所张成的子空间中,W=[w1,w2,w3,...,wm]T∈Rm×k为特征权值矩阵;
3)构建内积正则项约束用于降低特征的相关性:
4)构建基于内积正则化非负矩阵分解的特征选择目标函数:其中,公式(3)的第一项是度量被选特征表示原始高维数据的能力,第二项是确保特征权矩阵W是稀疏和低冗余的,β是平衡这两项之间的权衡参数;
5)通过迭代优化策略求解目标函数;
6)计算||wi||2,i=1,2,...,m值按升序方式排序m个特征,选择前p个特征形成最优特征子集,它们对应的索引集合{idx1,idx2,...,idxp}作为最终输出。
2.根据权利要求1所述的方法,其特征在于:通过迭代优化策略求解目标函数的具体步骤为:
1)初始化权值矩阵W=rand(m,k)和系数矩阵H=rand(k,m),其中,rand()为随机函数,k为任意非负整数,最大迭代次数T,t=1;
2)重复执行以下几步直到t>T:
a)计算对角矩阵
b)计算W=WD-1和H=DH;
c)固定H,更新W:
d)固定W,更新H:
e)t=t+1。