1.信息反馈极限学习机优化估值的缺失数据模糊聚类算法,其特征在于,步骤如下:
1)采用互信息计算并选择相关度较高的数据属性,依据这些属性选择不完备数据中的完备数据作为FELM网络的训练样本;
其中,μX(x)表示变量X的边缘概率密度函数;μY(y)表示变量Y的边缘概率密度函数;μXY(x,y)表示变量之间联合概率密度函数;
2)对FELM网络参数确定:初始化输入权值ω以及偏置值b;ω和b的初始化值设置在区间[-1,1]之间,随机选取该区间的任意随机数对网络进行初始化,确定极限学习机的隐藏层节点数;
3)根据最近邻规则对缺失属性进行预填充,并根据训练样本训练FELM网络得到的误差采用误差检索法对预填充值进行调整直至找到合理的数值进行填补,进而得到恢复后的完整数据集;
4)初始化模糊C均值算法的参数,聚类数目c,模糊系数m,阈值ε及隶属度划分矩阵U(o);
5)利用模糊C均值对恢复后的完整数据集进行聚类,当迭代次数t=l时,根据公式(2)和隶属度划分矩阵U(l-1)计算聚类中心矩阵V(l),根据公式(3) 和V(l)更新U(l),对于给定的阈值ε,如果 算法终止;否则,l=l+1,继续迭代更新隶属度划分矩阵和聚类中心。
。
2.根据权利要求1所述的信息反馈极限学习机优化估值的缺失数据模糊聚类算法,其特征在于,所述步骤3)根据最近邻规则对缺失属性进行预填充,并根据训练样本训练FELM网络得到的误差采用误差检索法对预填充值进行调整直至找到合理的数值进行填补,进而得到恢复后的完整数据集的过程如下:
1)根据最近邻规则对缺失属性进行预填充,选取距离该数据样本最近的k个数据,对缺失数据的相应位置求k个数据样本相应位置的平均值,将该值作为不完备数据的预填充值。
其中,xa和xb的第i个属性分别是xia和xib,并且Ii满足的条件如公式(5)所示:
2)FELM网络隐藏层输出矩阵的计算,利用公式(6-8)对隐藏层的输出矩阵H进行计算;
其中, 表示的是第i个隐藏层的输出; 是 与xj的内积; 则表达的是输入层与隐藏层之间链接的输入权重;βi描述的则是隐藏层与输出层之间链接的输出权值;bi表示的是第j个隐藏层的偏置值。
Hβ=T (7)
其中,H是隐藏层节点的输出,β为输出权重,T为期望权重。
2)FELM网络输出权值的计算,根据公式(9)使用上述得到的输出矩阵H以及期望输出值对输出权重进行计算;
其中, 是H的Moore-penrose广义逆矩阵,的范数是最小且唯一的。
3)得到实际输出值与真实输出值之间的误差,对误差进行反馈,假设极限学习机输出的预测值为y,而实际该值为Y,误差为e0;
e0=Y-y (10)
4)判断求得的误差与训练样本得到误差之间的大小关系,若满足迭代停止要求,则对缺失属性进行填充,否则接受误差,重新调整预填充值,返回步骤1)。
3.根据权利要求2所述的信息反馈极限学习机优化估值的缺失数据模糊聚类算法,其特征在于,所述的误差检索法,具体过程如下:假定对缺失属性使用k近邻规则得出的初始估计值为Ek,使用FELM网络对训练样本得出误差均值为 若对于包含缺失属性数据进行FELM学习预测得出的输出值为y,而其数据真实值为Y,那么会得到误差e0=Y-y,计算 调整缺失属性的填充值:
1)若e<0,那么重新调整缺失属性的填充值Enew=Ek+ρe,即以一定的概率去增加这个值,然后作为输入再进行FELM学习,这里的ρ∈[0,1]是根据随机函数随机选取的;
2)若 那么重新调整缺失属性的填充值Enew=Ek-ρe,然后作为输入再进行FELM学习;
3)若 那么说明通过FELM网络预测的值,与真实值很贴近,是可以接受的,故将该值作为不完备数据集缺失属性的填充。
4.信息反馈极限学习机优化估值的缺失数据模糊聚类算法在带钢数据聚类统计中的应用,其特征在于,包括如下过程:
1)采集实验数据:采集带钢某一时段收集的数据,作为数据样本;
2)从该采集数据样本提取以下属性:轧制机架的轧制力、轧制辊间辊缝隙大小、轧制辊间辊缝差、入口温度、出口温度、轧制电流大小、轧制速度、SONY值;
3)将步骤2)采集的属性值作为训练数据集;
4)对数据集进行归一化处理。因为数据属性数量级等原因,首先要将数据集中所有数值进行转化到[0,1]区间内的相应值,以消除数据间的差异;
5)对训练样本选择并优化。采用互信息计算并选择相关度较高的数据属性,依据这些属性选择不完备数据中的完备数据作为FELM网络的训练样本。
6)对FELM网络参数确定。初始化输入权值ω以及偏置值b。ω和b的初始化值设置在区间[-1,1]之间,随机选取该区间的任意随机数对网络进行初始化,确定极限学习机的隐藏层节点数;
7)缺失属性估值。根据最近邻规则对缺失属性进行预填充,并根据训练样本训练得到的误差采用误差检索法对预填充值进行调整直至找到合理的数值进行填补;
8)使用FCM算法对恢复完整的数据集进行聚类分析。