1.一种基于FNN的张量异质集成车联网缺失数据估计方法,其特征在于该方法主要包括如下步骤:第1、系统模型构建
包括数据张量模型和多维数据插补模型的建立;
第2、采样阶段
包括原始数据形成张量数据集,对数据集进行Bootstrap自主采样,形成最终张量数据集;
第3、模型构建阶段
根据相关参数形成分解器组件,针对基分解器进行最优权值计算,根据目标函数最终形成张量异质集成模型;目标函数如公式(12)所示,为因子矩阵;
第3.1、分别对利用新策略采样得到的数据进行张量分解,形成分解器组件;
第3.2、对基分解器进行最优权值计算;
针对路网交通不完整时空数据插补,采用异质集成学习思想,把多个单一模型进行权值最优组合,针对不同的张量基分解器模型进行异质集成形成组件分解器,张量分解模型由张量分解提取出的主成分以及相关系数构成,以分解模型与原始张量的误差为优化目标,恢复张量结构下缺失的数据,张量分解模型分别为加权优化张量分解模型CP_WOPT、HOSVD‑WOPT模型以及HalRTC模型,分别从不完整的网络配置张量D中获得相应的估计CP_WOPT算法是利用CP分解模型,采用梯度优化的方法,基于一阶导数求解原始张量与分解模型之间误差的最优解,针对大规模稀疏张量,CP‑WOPT算法采用稀疏的张量表示法,如公式(14)所示,W为与含缺失值的原始张量X大小相同的张量,其中已知元素值取1,未知(1) (2) (N)元素值取0,A ,A ,…,A 为因子矩阵;
HOSVD–WOPT算法是针对稀疏张量的基于Tucker分解模型,WOPT为带权值的优化;
HalRTC算法是:
矩阵Bi(i)表示张量Bi在模态i下的展开,将张量模型进行异质集成,得到集成张量插补模型为:第3.3、异质集成新的组件模型;
张量分解的异质集成选取CP_WOPT、HOSVD_WOPT及HalRTC算法作为组件的基张量分解器,对遴选的张量分解器做最优权值集成,权值代表分解器在集成中的重要性,计算3个基分解器函数Aw(x),At(x),Ah(x)最优权值p1,p2,p3,并可将其推广到N阶,分解器的泛化误差如公式,如公式(18)所示,其中,Ai(x)表示分解器函数, 表示最优分解器,定义第i个分解器与第j个分解器的相关度如公式(19)所示,加入组件分解器权重,根据公式(18)、(19)得到异质集成得泛化误差,如公式(20)所示,第4、模型优化阶段
首先进行模糊神经网络构建,接着对形成的张量异质集成模型进行优化,对比目标函数选择最优;具体包括:第4.1、通过训练与预测,进行模糊神经网络的构建;
模糊神经网络由前件网络和后件网络两部分组成,前件网络用来匹配模糊规则,后件网络用来产生模糊规则,
1)前件网络:前件网络由四层组成,第一层为模糊神经网络输入层,设输入向量x=[x1,Tx2,...,xn],xi为输入层的输入值,用于表示张量分解的各项指标m,中间一层为模糊化层,针对输入数据进行模糊处理,计算各输入分量执行相应的隶属度函数 其中i=1,2,…n;
j=1,2,…m,n为输入参数,m为模糊子集数,隶属度函数如公式(21)所示,其中 和 分别为隶属度函数的中心和宽度,中间二层为模糊规则层,用于匹配模糊规则的前件,将隶属度进行模糊计算,采用模糊算子为连乘算子,如公式(22)所示,中间三层实现归一化计算,如公式(23)所示,
2)后件网络:后件网络由各结构相同的并列子网组成,每个子网产生一个输出量,T‑S模糊规则后件是输入变量的线性组合,模糊系统的输出量为每条规则的输出量的加权平均,后件网络的第一层是输入层,其中x0=1,为模糊规则后件常数项,第二层计算每一条模j糊规则后件,如公式(24)所示,其中 为模糊系统参数,y为输出,第三层为归一化后实际输出,如公式(25)所示,
3)模糊神经网络学习算法
网络期望输出与实际输出误差值e的计算,如公式(26)所示,其中,yd为期望输出值,yc为实际输出值,系数修正如公式(27)所示,参数修正如公式(28)、(29)、(30)所示,其中,α为网络学习率,第4.2、针对异质集成新的张量模型,进行模糊神经网络优化;
在基于最优权值集成的张量分解器的基础上,用平均绝对百分比误差(MAPE)、加权相对误差(MAD)、均方根误差(RMSE)三个指标估算性能,秩值R选取范围为5‑35,形成训练集第一层:模糊神经网络的输入层,模型分别引入CP_WOPT、HOSVD_WOPT及HalRTC基张量分解器的MAPE、MAD、RMSE,m=9个精度指标,作为模型的输入函数,结合最优权值集成为输入的每个参数都对其定义了模糊集合的具体位置等级,指定 为模糊神经网络的每层输出值,对模糊神经网络本身进行样本训练;
第二层:模糊神经网络隶属函数生成层,针对输入数据进行模糊处理,计算各输入分量执行相应的隶属度函数μ(xi),其中 和 分别为隶属度函数的中心和宽度;
第三层:模糊神经网络规则层,相连系统输入变量的模糊子集,输入是隶属度,输出是相应规则的权重因子;
第四层:系统输出层,最优目标函数的性能指标:
其中dm是第m集对应于期望输出的输入矢量;ym是对应于实际输出第m个输入向量,N是训练样本的总数;
第4.3、对比目标函数选择最优。
2.根据权利要求1所述的基于FNN的张量异质集成车联网缺失数据估计方法,其特征在于,第2步所述采样阶段包括:第2.1、原始数据形成张量数据集,对原始的交通多维数据进行采集,大量的城市交通数据通过环路探测器、微波检测器、视频传感器以及浮动车等路网中固定或移动的传感器不断收集,进行张量设置与性能度量;
第2.2、采用新策略对张量进行采样,运用Bootstrap技术,根据均匀概率分布,对含缺失、低质等原始张量数据进行随机抽样,获取多个有多样性差异的样本,样本规模与原始张量数据集一样;
第2.3、通过新策略采样,增加了张量分解性能间的差异度,形成最终张量数据集。