欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2019106247157
申请人: 齐鲁工业大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-01-05
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于有效值存储及运算方式的关联规则挖掘方法,其特征在于,该方法步骤如下:S1、基于有效值的集合存储:设置存储集合,存储集合存储频繁单项所在事物的索引位置,即有效值1的位置值;

S2、基于有效值存储结构的连接操作:对两个存储集合进行连接操作生成候选项集。

2.根据权利要求1所述的基于有效值存储及运算方式的关联规则挖掘方法,其特征在于,所述步骤S1中基于有效值的集合存储的具体步骤如下:S101、扫描一遍事务数据库,对于事务集中的每一个频繁单项,设置一个存储集合;

S102、存储集合存储频繁单项在事务中出现的索引位置,即有效值1的位置值。

3.根据权利要求1或2所述的基于有效值存储及运算方式的关联规则挖掘方法,其特征在于,所述步骤S2中基于有效值存储结构的连接操作具体步骤如下:S201、查找频繁单项集合:数据库生成的存储集合后,根据存储集合的支持度是否达到最小支持度找出频繁单项集合;

S202、对两个存储集合进行取交集得到存储两项集的新集合:对频繁单项集合执行连接操作,即对存储单项集的存储集合执行取交集操作,得到存储两项集的新集合;

S203、生产频繁项集:将步骤S1中生成的存储集合进行连接操作,得到两项集,通过最小支持度来判断两项集是否为频繁项集,并依次迭代生产频繁项集:①、若是,则依次进行迭代操作,即重复执行步骤S203,直至找不到频繁项集为止。

4.根据权利要求3所述的基于有效值存储及运算方式的关联规则挖掘方法,其特征在于,所述步骤S2中对两个存储集合进行连接操作选取候选项集的原理为:对集合Aarr和集合Barr执行取交集操作,设集合Aarr和集合Barr均为有序排列,具体算法如下:(1)、设遍历集合Aarr的索引值m为0,遍历集合Barr的索引值n为0;

(2)、判断Aarr.get(m)与Barr.get(n)的大小关系:①、若Aarr.get(m)大于Barr.get(n),则跳转至步骤(3);

②、若Aarr.get(m)小于Barr.get(n),则跳转至步骤(4);

③、若Aarr.get(m)等于Barr.get(n),则跳转至步骤(5);

(3)、令n等于n+1,判断n值是否超过集合Barr中元素的数目:①、若是,则跳转至步骤(6);

②、若否,则跳转至步骤(2);

(4)、令m等于m+1,判断m值是否超过集合Aarr中元素的数目:①、若是,则跳转至步骤(6);

②、若否,则跳转至步骤(2);

(5)、将n在集合Barr中对应的值或m在集合Aarr对应的值添加到候选项集Sarr中,同时令n等于n+1,m等于m+1,判断m、n值中是否有超过其对应集合中元素的数目:①、若是,则跳转至步骤(6);

②、若否,则跳转值步骤(2);

(6)、运算结束,得到候选项集Sarr的大小即为候选项集的支持度计数。

5.根据权利要求4所述的基于有效值存储及运算方式的关联规则挖掘方法,其特征在于,所述存储集合是按字典顺序进行排序,可知:当Aarr.get(m)小于Barr.get(n)时,按照字典顺序Barr.get(n)后面的数均大于Aarr.get(m),故Barr(n)之后不会存在与Aarr.get(m)相同的值,Aarr.get(m)无需再与Barr.get(n)后面的值进行比较,进而令m+1,Aarr.get(m+1)继续与Barr.get(n)后面的值比较大小即可。

6.根据权利要求5所述的基于有效值存储及运算方式的关联规则挖掘方法,其特征在于,根据对两个存储集合进行连接操作选取候选项集的原理完成所述步骤S2中基于有效值存储结构的连接操作的具体步骤如下:(一)、计算集合Aarr与Barr的交集,判断两个集合是否存在相同的位置值:①、若集合Aarr与集合Barr的交集候选项集Sarr为空,则表示集合Aarr与集合Barr不存在相同的位置值,无法组合产生新的候选项集;

②、若候选项集Sarr不为空,则下一步执行步骤(二);

(二)、计算候选项集Sarr的大小,用得到候选项集Sarr的值再除以事务总数,即为候选项集Sarr的支持度;

(三)、根据候选项集Sarr的支持度和最小支持度判断该候选项集Sarr对应的项集是否为频繁项集:①、若是,则保留用作下一次连接过程,下一步跳转至步骤(一),直至从候选项集中查找不到频繁项集;

②、若否,则将该候选项集Sarr删除,以节约存储空间。