1.一种基于张量的车联网数据缺失多重估计新方法,其特征在于该方法主要包括如下步骤:第1、模型构建,包括张量模型基本思想,贝叶斯张量分解基本原理,采样新策略,择优排序机制;
第2、基于张量的车联网数据缺失估计算法,包括算法设计和复杂度理论分析;
第3、做实验测试和对比分析;
其中基于张量的车联网数据缺失估计算法包括:第2.1、将交通数据按路段*天*日流量的形式生成三阶张量数据模型,用于评估算法性能;
第2.2、将生成好的缺失张量数据用随机采样算法得到与原始缺失张量数据不同的不完整随机张量数据集,此处调用采样新策略算法;
第2.3、将生成后的不完整随机张量数据集通过贝叶斯张量分解算法进行插补,此处调用贝叶斯张量分解算法;
第2.4、将所有插补结果的误差参数进行冒泡排序,择优,将择优后的插补数据进行算数平均处理,得到更贴近原始数据的修复数据,此处调用冒泡排序机制算法。
2.根据权利要求1所述的基于张量的车联网数据缺失多重估计新方法,其特征在于:步骤2.2采样新策略算法为:算法描述:
输入为样本T={(x1,y1),(x2,y2),...,(xm,ym)},基修复器贝叶斯张量算法,基修复器迭代次数t;
输出为最终的修复器f(x);
1)对于q=1,2...,t:
a)对训练集进行第t次随机采样,共采集m次,得到包含m个样本的采样集Tt,b)用采样集Tt训练第t个弱学习器Gt(x);
2)对Q个基修复器得到的插补结果进行择优算术平均得到的值为最终的模型输出。
3.根据权利要求1所述的基于张量的车联网数据缺失多重估计新方法,其特征在于:步骤2.3贝叶斯张量分解算法算法描述:
1)通过公式(21)计算共轭先验超参数 得到先验分布;
2)根据公式(12)、(13),计算 得到后验分布;
3)根据公式(22),计算 得到精度参数的Gamma分布;
其中:
4)重复更新参数直至收敛;
以上公式中各参数代表的含义是:
先验分布:
后验分布:
精度参数的Gamma分布:
4.根据权利要求1所述的基于张量的车联网数据缺失多重估计新方法,其特征在于:步骤2.4冒泡排序机制算法为:算法描述:
1)比较相邻的元素,如果第一个比第二个大,就交换它们两个;
2)对每一对相邻元素作同样的工作;
3)针对所有的元素重复以上的步骤,除了最后一个。
5.根据权利要求1所述的基于张量的车联网数据缺失多重估计新方法,其特征在于,实验测试和对比分析包括:第3.1、将采集数据张量表示;
第3.2、根据数据缺失情况进行修复,通过分析得出新算法对比旧算法的优势。
6.根据权利要求1所述的基于张量的车联网数据缺失多重估计新方法,其特征在于:步骤2.1中张量数据模型包括两种情况:随机性缺失和非随机性缺失,建立两种不同的缺失数据模型。