1.一种应用于购买模式下的高效用周期频繁模式挖掘的方法,其特征在于,包括如下步骤:
步骤1,输入一段时间内客户购买的商品和数量的数据库,商家自定义五个阈值,即最小支持率阈值minSupRa、最大周期性阈值maxPr、最大标准偏差阈值maxStd、最小高效用阈值minHuRa和最小序列周期率阈值minSeqRa;
步骤2,扫描数据库构建1项集x的HUPFPS‑list,即构建关于某个商品x出现在哪几个用户的购买序列中、按照时间顺序依次出现在哪笔交易中以及商品的效用构成的数据列表HUPFPS‑list,判断1项集x是否为高效用周期频繁模式HUPFPS,具体包括:步骤2.1,扫描数据库中的每条序列并计算出1项集x的支持率supRa({x}, S),最大周期性maxPer({x}, S),效用比率utiRa({x}, S)和1项集x的周期标准差stanDev({x}, S);
对于出现在购买序列S中的商品x,如果商品x的购买频率大于最小购买频率,即supRa({x}, S)≥minSupRa,商品x前后两次被购买的时间间隔不超过最大周期阈值,即maxPer({x}, S)≤maxPr ,商品x的购买周期稳定在一定范围内,即stanDev({x}, S)
步骤2.2,根据集合huPrSeq(x)计算huSeqRa(x),如果高效用周期序列比huSeqRa(x)≥minSeqRa,则输出1项集x是一个高效用周期频繁模式HUPFPS项集;
其中,1项集x在数据库中满足集合huPrSeq(x)的序列个数为|huPrSeq(x)|,1项集x在数据库中的高效用周期序列比值被定义为huSeqRa(x) = |huPrSeq(x)|/|D|,其中|D|是数据库的序列数量;
步骤3,根据上界值upSeqRa对搜索空间进行修剪,将符合条件upSeqRa(x)≥minSeqRa的1项集x的HUPFPS‑list添加到集合boundHUPFPS,不符合条件的不再进行扩展;
步骤4,利用集合boundHUPFPS将修剪后的1项集进行相交合并成2项集即2个商品数据信息的组合,构建2项集的HUPFPS‑list,将符合upSeqRa(x)≥minSeqRa的项集的HUPFPS‑list保存至boundHUPFPS,以便进行新一轮迭代,并且判断2项集是否为HUPFPS;
步骤5,递归循环n‑1项集的HUPFPS‑list生成n项集,直至不能扩展n项集,则输出所有高效用周期频繁项集。
2.根据权利要求1所述的一种应用于购买模式下的高效用周期频繁模式挖掘的方法,其特征在于,一个商品构成的项集为1项集x,多个商品构成的项集为X,项集X在数据库中满足出现过某个商品x的交易的数量supRa(X, S)≥minSupRa,项集X的最大周期性maxPer (X,S)≤maxPr和效用比率utiRa(X, S)≥minHuRa的所有序列集合记为huCand(X)={ S1,...,Sn },被称为高效用周期频繁候选模式,其集合中序列的个数记作|huCand(X)|,在数据库中项集X的高效用周期序列比值上界被定义为upSeqRa(X) = |huCand(X)|/|D|。
3.根据权利要求2所述的一种应用于购买模式下的高效用周期频繁模式挖掘的方法,其特征在于,序列S中项集X的支持率被定义为supRa(X, S) = sup(X, S)/|S|,其中|S|是序列S中包含的交易总数;
序列S中包含出现过某个商品X的交易的次数被定义为sup(X, S) = |TR(X, S)|。
4.根据权利要求2所述的一种应用于购买模式下的高效用周期频繁模式挖掘的方法,其特征在于,设一条购买序列S中的项集X的总效用为u(X, S),序列S的总效用为su(S),其比值被定义为utiRa(X, S) = u(X, S)/su(S),其中utiRa(X, S)被称为效用比率。