1.一种融合K‑means和KNN的GNSS数据质量综合评估方法,其特征在于,包括以下步骤:S1、选取全球密集GNSS监测网观测数据,对观测数据进行数据预处理,得到观测数据的数据完整率、信噪比值、伪距多路径值和周跳比值并构建样本数据集,观测数据的数据完整率、信噪比值、伪距多路径值和周跳比值的确定方法为:S1‑1、利用实际观测数据的历元总数和理论观测历元总数,获得观测数据对应各测站的GPS、GLONASS、BDS、Galileo系统中各卫星所有频点的数据完整率,S1‑2、利用各测站提供的RINEX观测文件,获得观测数据对应各测站的GNSS系统各卫星所有频点的信噪比值,S1‑3、基于观测数据,对伪距观测方程和载波相位观测方程进行组合,消除对流层和电离层延迟,求得伪距多路径值,S1‑4、采用MW组合观测量 和GF组合观测量 联合进行检测周跳,提取到发生周跳历元数据量,求得周跳比值;
S2、通过K‑means算法对样本数据集进行非监督聚类分析,得到经过分类的数据集,所述经过分类的数据集包括多个聚类,每个聚类对应的分类标签记为Lab1;
S3、基于轨道和钟差产品求得PPP定位结果,将K‑means算法聚类分析结果中每一类数据的PPP定位结果均值作为定位精度特征,并将定位精度特征按照从大到小的顺序进行排序,得到定位精度特征标签,记为Lab2,并采用所述Lab2替换所述Lab1;
S4、基于样本数据集和KNN算法构建GNSS数据质量综合评估模型,得到GNSS观测数据测站的分类结果;
S5、对GNSS数据质量综合评估模型准确率进行验证。
2.如权利要求1所述的一种融合K‑means和KNN的GNSS数据质量综合评估方法,其特征在于,所述步骤S1中选取全球密集GNSS监测网观测数据时,观测数据的采样率为30s,卫星截止高度角为10°。
3.如权利要求1所述的一种融合K‑means和KNN的GNSS数据质量综合评估方法,其特征在于,所述步骤S2具体包括以下步骤:S2‑1、采用Z‑score标准化方法对观测数据进行质量指标计算,得到质量指标无量纲归一化数据集;
S2‑2、从质量指标无量纲归一化数据集中随机选取k个数据对象作为初始聚类质心;
S2‑3、计算剩余数据对象与各个簇中聚类质心的欧氏距离,并依据最小距离将剩余数据分配到相应的簇,并将所有簇的平均值作为下一次迭代的聚类质心;
S2‑4、重复步骤S2‑2及步骤S2‑3,直至误差平方和局部最小,最终得到分类标签Lab1。
4.如权利要求3所述的一种融合K‑means和KNN的GNSS数据质量综合评估方法,其特征在于,所述步骤S2‑1中质量指标无量纲归一化数据集的确定方法为:S2‑1‑1、基于倒数逆变换法对观测数据中各频点的伪距多路径值取倒数得到正向化伪距多路径值,转换公式为:式中, 为伪距多路径值, 为正向化伪距多路径值;
S2‑1‑2、基于Z‑score标准化方法对观测数据的数据完整率、信噪比、伪距多路径值、周跳比均值和标准差进行数据标准化处理,经过处理的数据符合标准正态分布,转化函数为:其中, 为数据对象, 为所有观测数据指标的均值, 为所有观测数据指标的标准差, 为标准化处理后的数据。
5.如权利要求4所述的一种融合K‑means和KNN的GNSS数据质量综合评估方法,其特征在于,所述步骤S2‑3中剩余数据对象与各个簇中聚类质心的欧氏距离计算公式为:式中, 为数据质量对象,为定位结果对象, 为数据质量对象 和定位结果对象 之间的距离, 为第 个数据质量对象, 为第 个定位结果对象。
6.如权利要求4所述的一种融合K‑means和KNN的GNSS数据质量综合评估方法,其特征在于,所述步骤S2‑4中误差平方和计算公式为:式中, 为误差平方和, 、 均表示数据对象,表示簇的个数, 表示数据对象 属于簇 , 表示数据对象 是簇 的质心。
7.如权利要求1所述的一种融合K‑means和KNN的GNSS数据质量综合评估方法,其特征在于,所述步骤S3具体包括以下步骤:S3‑1、采用伪距多路径值和载波观测值同时利用精密钟差与轨道产品,通过插值获取精密的轨道与钟差信息,组建解算法方程并采用序贯最小二乘法进行解算,获得PPP定位结果;
S3‑2、步骤S2得到的各聚类分别累计聚类所有元素的PPP定位结果并计算均值,基于该均值排序生成定位精度特征标签,记为Lab2,并采用所述Lab2替换所述Lab1。
8.如权利要求1所述的一种融合K‑means和KNN的GNSS数据质量综合评估方法,其特征在于,所述步骤S4中,GNSS数据质量综合评估模型的构建方法为:S4‑1、通过欧式距离公式得出待分类样本点与各个训练样本点之间的距离值;
S4‑2、将待分类样本点与各个训练样本点之间的距离值按顺序进行排列,选取出M个最近邻的距离值,M个距离值中所占比例最高的类别即为预测类别;
S4‑3、建立GNSS数据质量综合评估模型。
9.如权利要求1所述的一种融合K‑means和KNN的GNSS数据质量综合评估方法,其特征在于,所述步骤S5具体包括以下步骤:S5‑1、选取全球MGEX测站,根据获得的全球分布的监测站的分类情况,分析观测数据的数据完整率、信噪比值、伪距多路径值和周跳比值之间的相关性;
S5‑2、采用n折交叉验证对GNSS数据质量综合评估模型进行验证,具体包括以下步骤:S5‑2‑1、将样本数据集均分为n个部分,并保持每一部分中的类比例与样本数据集中的类比例一致,S5‑2‑2、将每个部分轮流作为测试数据集,其余n‑1个部分作为训练数据集,共对GNSS数据质量综合评估模型进行n次学习,每次得出对应学习结果的分类正确率,最后将n个分类正确率进行平均计算得到分类正确率均值,作为GNSS数据质量综合评估模型的最终分类正确率。