1.一种改进KNN方法的数据处理方法,其特征在于:包括以下步骤:步骤一、从数据库信息中获取数据信息,并对获取的数据信息进行降维处理,以获取低维度数据信息;
步骤二、通过改进KNN算法模型对降维后的数据信息进行数据信息处理,改进KNN算法模型包括数据预处理步骤、数据分层步骤、数据KNN算法计算步骤和卷积分故障诊断步骤;
步骤三、通过改进型误差评估函数对处理后的数据信息进行评估;
步骤四、数据信息应用与分享,对获取的数据信息进行远程数据信息处理和数据分享。
2.根据权利要求1所述的一种改进KNN方法的数据处理方法,其特征在于:降维处理的方法包括以下步骤:(S11)通过重构矩阵数据信息的方式实现降维处理,并设置重构矩阵数据个数、数据维度和时间延迟;
(S12)通过平均交互信息法求解不同元素库的分布概率,并通过关联算法模型分析数据特征;
(S13)通过虚假邻点法计算数据信息的维数,通过比较不同数据信息的维数进而选择不同的数据分类,两个不同维度之间的序列通过特征对度量法实现数据库信息内不同元素之间的比较,公式为: (1)
在公式(1)中,R表示数据维度,n表示向量, 表示重构前的矩阵数据信息, 表示重构后的矩阵数据信息; 与 表示重构矩阵数据之间的虚假邻点的关系,r 表示重构后增加的数据信息,u为重构矩阵数据信息最佳维度,重构后,重构矩阵数据的元素数据维度和降维后的数据维度之差大于10;
(S14)降维判断,当降维数据信息满足当前需求时,则输出数据信息,当降维数据信息不满足当前需求时,则重新进行降维计算。
3.根据权利要求1所述的一种改进KNN方法的数据处理方法,其特征在于:数据分层为差分分层,差分分层的方法为:将数据属性按照数量和种类划分为不同的属性,属性数据量从顶层到底层从少至多依次排列和分布;
计算不同数据属性之间的距离,假设数据集合中的某个数据信息为 ,数据属性类别划分为 、 、 和 ,则数据信息 距离数据属性类别 、 、 和 之间的距离为、 ;
将计算出的不同数据属性数据信息进行差分计算;当 时,其中 为常数,则数据信息 划分到 类。
4.根据权利要求1所述的一种改进KNN方法的数据处理方法,其特征在于:数据KNN算法包括以下步骤:(S21)选择大数据信息测试集合,根据不同的数据属性选择测试大数据信息向量集合;
(S22)训练大数据信息测试集合,通过分层类别,构建成 n 层树状形式;并通过最佳搜索算法实现大数据信息测试集合的数据搜索;
(S23)依次计算大数据信息测试集合与第 1‑n 层大数据信息测试集合训练集中每个大数据信息的文本相似度;
通过欧式距离计算公式如下:
(2)
在公式(2)中, 表示大数据信息测试集合中测试信息的特征向量, 表示大数据信息测试集合中测试信息的特征向量的序列; 为第 1 层第j类的大数据信息测试集合中心向量,表示大数据信息的类;M为大数据信息测试集合特征向量的维数; 为大数据信息测试集合向量的第 k 维; 表示第 k 维中第一层第j类的大数据信息测试集合向量;
(S24)按照文本相似度,在训练文本集中选出与测试文本最相似的 个文本;
(S25)在测试文本的 个近邻中,依次计算每类的权重, 表示权重值公式,计算式为,其中 为数据信息, 表示第 类的大数据信息测试集合中测试信息的特征向量,表示杰卡德相似系数, 为相似度计算公式, 表示相似度程度值,其中 的取值为1 或者0,如果 属于 ,则函数 值为 1,否则为 0;
(S26)对计算的权重进行排序,对排序后的权重进行差分比较,当 时,其中表示特征的数据集,则测试文本属于第 1 类,在对第二层进行相似度比较的时候,只需要比较第二层中第 1 类的子类;如果 ,则继续进行判断,存在 ,当 时,则测试本文属于1‑ 类中的其中一类,在对第二层进行比较时,只需要比较第二层中第 1 类中第 类的子类 ;如果 时,则继续进行判断;其中 表示排序后的向相邻权重的差分值, 表示设置的大数据信息测试集合阈值差分值, 表示存在 类大数据信息测试集合距离值的差分值。
5.根据权利要求1所述的一种改进KNN方法的数据处理方法,其特征在于:卷积分故障诊断方法包括以下步骤:通过扩张因果卷积与残差块构成故障诊断体系结构,残差块如公式(3)所示:(3)
在公式(3)中,O是卷积分故障诊断模型输出层的输出变量, 表示分故障诊断模型输出层的输入变量, 表示深度学习的残差映射,在权重层之后,添加设置退出层,扩张因果卷积函数F(t)定义为:(4)
公式(4)中, 是过滤器;是神经网络的层级;表示输入的时间序列信息;为空洞参数,空洞间隔大小;表示空洞卷积算子;
故障诊断体系结构的评估公式为:
(5)
公式(5)中, 表示大数据信息故障评估指标均值,T表示预测持续周期,表示预测大数据信息故障体系结构的评估持续周期参数, 表示深度学习模型各项超参数,θ表示故障诊断体系结构评价指标,表示大数据信息故障诊断体系结构评价指标的参数,通过建立正交化的评估矩阵将大数据信息故障评估指标进行信息交叠,不同信息之间相互影响迭代过程为:(6)
公式(6)中,α表示大数据信息故障评估指标相互交叠函数,β表示大数据信息之间相互影响迭代过程,根据大数据信息故障评估指标之间的迭代公式,对公式(6)矩阵建立算法程序,即:(7)
公式(7)中, 表示大数据信息故障评估正交化安全矩阵,μ表示正交化矩阵编辑参数;
然后将各项大数据信息故障评估指标数据通过施密特公式应用在数据信息智能预测平台中,在线测试获得最佳评估效果输出为:(8)
公式(8)中, 表示验算的各项数据信息评估指标效果,m表示大数据信息架构节点数量,表示大数据信息架构节点数量的变量值,通过判定评估指标效果,进而计算权重公式,权重公式为:(9)
公式(9)中, 表示大数据信息故障评估指标权重。
6.根据权利要求1所述的一种改进KNN方法的数据处理方法,其特征在于:改进型误差评估函数为 (10)公式(10)中,包含有 组数据,其中 表示为大数据信息测试样本, 表示为大数据信息故障预测样本。
7.一种改进KNN方法的数据处理装置,包括:
数据获取模块,从数据库信息中获取数据信息,并对获取的数据信息进行降维处理,以获取低维度数据信息;
数据处理模块,通过改进KNN算法模型对降维后的数据信息进行数据信息处理;
数据评估模块,通过改进型误差评估函数对处理后的数据信息进行评估;
数据共享模块,数据信息应用与分享,对获取的数据信息进行远程数据信息处理和数据分享;
其中所述数据处理模块分别与数据获取模块、数据评估模块和数据共享模块连接。