欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 201611259383X
申请人: 重庆邮电大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-02-28
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于MPI并行求信息系统属性约简的方法,其特征在于,包括以下步骤:

步骤1)、在数据预处理阶段,读取信息系统的数据,将数值进行预处理,即离散化处理,根据数据的特征,使得连续数据离散化;

步骤2)、将信息系统以样本为单位均匀地水平划分为p个样本数据子集,并将p个样本数据子集分配给n个节点,每个节点根据条件属性并行计算数据子集的等价类,再将各个节点的结果整合,从而得到整个信息系统的m个等价类划分,每个等价类对应一个子信息系统;

步骤3)、再将m个子信息系统分配给n个节点,各个节点对所分配到的子信息系统并行计算属性核,直到处理完所有子信息系统,再将各个节点的结果合并,得出原信息系统的属性核;

步骤4)、最后,再将原信息系统的属性核发送给各个节点并行求出属性约简,再将各个节点的属性约简结果进行合并整合,得到整个信息系统的属性约简结果。

2.根据权利要求1所述的基于MPI并行求信息系统属性约简的方法,其特征在于,所述步骤1)数据预处理阶段先读入信息系统具体包括:所述信息系统也即决策表为一个四元组IS=(U,A,V,f),其中U表示领域问题中所有对象的集合,称为论域;A=C∪D是属性集合,子集C和D分别表示条件属性集和决策属性集; Va是属性a的值域;f:U×A→V是一个信息函数,对一个对象的每一个属性赋予一个信息值,即 x∈U,有f(x,a)∈Va。

3.根据权利要求2所述的基于MPI并行求信息系统属性约简的方法,其特征在于,所述对信息系统的数据进行连续数据离散化时,根据数据的特征,可以采用等宽区间、等频区间法,基于属性重要性、基于聚类在内的离散化方法。

4.根据权利要求1-3之一所述的基于MPI并行求信息系统属性约简的方法,其特征在于,所述步骤2)信息系统的等价类划分是利用等价关系对论域按照条件属性进行分类,数据集的条件属性集,形式为{条件属性1,条件属性2,……条件属性p},该等价类中含有一致对象和不一致对象,若条件属性和决策属性均一致,则为一致对象,若条件属性一致,决策属性不一致,则为不一致对象。

5.根据权利要求4所述的基于MPI并行求信息系统属性约简的方法,其特征在于,所述步骤3)将m个子信息系统分配给n个节点,分配任务时采用主从模式,选择一个节点为主节点,剩下的节点为从节点,主节点负责将任务划分给各个从节点,接收从节点的任务执行结果,任务分配采用动态分配方式,采取随机分配或顺序分配方式,处理快的节点分配任务多,每一次将子信息系统分配给空闲的节点,直到所有子信息系统被处理完。

6.根据权利要求5所述的基于MPI并行求信息系统属性约简的方法,其特征在于,所述步骤3)并行计算属性核是在各个节点上创建子决策分辨矩阵,若子信息系统决策分辨矩阵中包含决策属性D,即子信息系统为不一致对象集,该子信息系统的属性核为 否则,找出子信息系统中决定决策的单属性,满足条件的各单属性的并集,即为该子信息系统的属性核。

7.根据权利要求2所述的基于MPI并行求信息系统属性约简的方法,其特征在于,所述并行求子信息系统的属性约简是在子决策分辨矩阵中,将包含核属性的元素的值修改为空集,从而得到一个新矩阵,再建立相应的析取逻辑表达式,将所有的析取逻辑表达式进行合取运算,得到合取范式,再将合取范式转换为析取范式形式,最后将所有核属性加入到析取范式中的每个合取项,得到子信息系统属性约简的结果。

8.根据权利要求6或7所述的基于MPI并行求信息系统属性约简的方法,其特征在于,所述创建子决策分辨矩阵的具体为:对每一个划分,找出该划分中各个元素与其他元素不同的属性。