1.针对多维整值型数据集的平行坐标改进方法,包含如下步骤:步骤1:针对数据集中的每一个整值型数据维统计其数据值的种类数,并计算各数据值的占比。
针对其中一个整值型数据维(设定为Di)的计算方法如下:
步骤1.1:将整值型数据维Di的所有数据,提取为一个向量(表示为Vi)。假如数据集中的数据记录数为T,则Vi向量的分量数据个数为T。
步骤1.2:统计Vi向量中数据值的种类个数(表示为NVi)。
步骤1.3:统计Vi向量中各数据值的记录数,按照记录数由多到少进行排序。将Vi向量中的各数据值,根据记录数由多到少的顺序,转换数据值为1至NVi,命名转换值为j的数据值为Vij,命名数据维Di中满足Vi=Vij的记录数为NVij。
本发明中将Vi向量中的各数据值的转换后的数据值称为“转换值”,Vi向量中各数据值的转换值取值范围为1至NVi。
步骤1.4:计算Vi向量中各数据值对应的记录占比。
步骤2:根据数据集中的所有整值型数据维的数据分布,建立坐标轴。假如数据集中同时存在非整值型数据维,则非整值型数据维对应的坐标轴建立方法保持传统方法不变。
针对整值型数据维Di对应的坐标轴建立方法为:
将坐标轴划分为NVi个分段,每个分段(称为坐标轴分段)对应数据维Di中的一种数据值,各坐标轴分段的高度与对应数据值的所占比例相关。通过本方法所建立的“整值型数据维”所对应的坐标轴,由不同种类的数据值对应的坐标轴分段组成,这种坐标轴在本发明中称为“分段坐标轴”。
坐标轴中各分段信息的计算方法为:
步骤2.1:根据最终可视化结果中“平行坐标系”中坐标轴的高度(表示为height),计算各数据值对应的“分段坐标轴”高度Hij。
步骤2.2:计算各“分段坐标轴”的起始高度Hstartij和结束高度Hendij。
步骤3:针对所有整值型数据维对应坐标轴的每一个“坐标轴分段”,计算一条数据记录的偏移高度Iij。
步骤4:根据步骤3中建立的坐标轴的相邻关系,计算所有“整值型数据维对应坐标轴”的数据值映射基础数据。
具体映射方法分为两种情况:一种是左侧相邻坐标轴对应的数据维为整值型数据维,该种情况下继续执行步骤5;另一种是左侧相邻坐标轴对应的数据维为非整值型数据维或当前数据维对应的坐标轴为最左侧坐标轴,该种情况下跳转至步骤6。
步骤5:本步骤是针对左侧相邻坐标轴对应的数据维为数值型数据维的情况下,数据值映射基础数据计算。
针对当前坐标轴,计算数据值映射基础数据步骤如下:
步骤5.1:设定当前“整值型数据维”坐标轴左侧“相邻坐标轴”所对应的为整值型数据维Du,设定该整值型数据维所提取的向量为Vu,向量Vu中数据值的种类数为NVu(NVu可根据步骤1.2计算得出)。
步骤5.2:统计整值型数据维Du与Di的交叉记录数,即针对任一Vu的转换值p和Vi的转换值q,统计满足Vu=Vup且Vi=Viq的记录数,命名该记录数为 其中Vup为转换值p对应的Vu中的数据值,Viq为转换值q对应的Vi中的数据值。
步骤5.3:根据向量Vu中数据值的种类数NVu,将当前坐标轴中数据值Viq所对应的坐标轴分段划分为NVu个“坐标轴子分段”。
步骤5.4:计算当前坐标轴中,所有坐标轴子分段的高度。
以Vu=Vup且Vi=Viq为例,其所对应的坐标轴子分段的高度步骤5.5:计算当前坐标轴中,所有坐标轴子分段的起始高度。
以Vu=Vup且Vi=Viq为例,其所对应的坐标轴子分段的起始高度记为步骤5.6:为当前坐标轴的每个“坐标轴子分段”设置该“坐标轴子分段”的“下一映射高度”。
步骤6:本步骤是针对左侧相邻坐标轴为非整值型数据维或当前数据维为最左侧数据维对应的坐标轴的情况下,数据值映射基础数据计算。
以Vi=Viq为例,其对应坐标轴分段的下一映射高度Hnextiq的初始值赋值为相应的Hstartiq,即为根据步骤2.2得出的数据值Viq对应的坐标轴分段的起始高度。
步骤7:针对数据集中的每一条记录,计算其各维数据值在其对应坐标轴上的映射高度。
针对每一条记录,假如当前数据维为非整值型数据维,则使用传统方法计算其数据值在其对应坐标轴上的映射高度;
假如当前数据维为整值型数据维,且对应的坐标轴左侧相邻的坐标轴为整值型数据维坐标轴,则继续执行步骤7.1;
假如当前数据维为整值型数据维,且对应的坐标轴为最左侧坐标轴或左侧相邻坐标轴为非整值型数据维,则继续执行步骤7.3。
步骤7.1:以整值型数据维Di中的数据值Vi=Viq为例,在其左侧坐标轴对应的数据维向量(命名为Vu)中获取该条记录的数据值(命名为Vup),即该条记录满足Vu=Vup且Vi=Viq。
根据Vu=Vup且Vi=Viq,在步骤5中获取其所对应的坐标轴子分段的下一映射高度即为该条数据在数据维Di对应的坐标轴上的映射高度。
步骤7.2:根据Vi=Viq,在步骤3中获取数据值Viq对应的“坐标轴分段”的一条记录偏移高度Iiq,更新跳转至步骤8。
步骤7.3:以整值型数据维Di中的数据值Vi=Viq为例,在步骤6中得到的Viq对应的坐标轴子分段的下一映射高度Hnextiq,Hnextiq即为该条数据在数据维Di对应的坐标轴上的映射高度。
步骤7.4:根据Vi=Viq,在步骤3中获取数据值Viq对应的“坐标轴分段”的一条记录偏移高度Iiq,更新Hnextiq。
步骤8:为区分整值型数据维对应坐标轴中的各坐标轴分段,可为各坐标轴分段设置不同的纹理,纹理的选择可使用具有区分性的颜色或底纹。
步骤9:根据步骤1至步骤8中得出的坐标轴信息、所有记录的映射高度及各坐标轴分段纹理,绘制当前数据集的改进后的平行坐标可视化结果。