1.一种基于向量运算的关联规则挖掘方法,其特征在于,包括以下步骤:定义对象和属性的向量表示,约定对象向量和属性向量的运算规则,用于计算属性集上的向量基;
根据向量基计算生成属性集上的向量;
根据所述属性集上的向量计算属性集上的任一向量的支持度;
设定向量基的支持度阈值,筛选出大于支持度阈值条件的向量;
根据预先设定的可信度阈值,在所述大于支持度阈值条件的向量中挖掘满足条件的属性关联规则。
2.根据权利要求1所述的一种基于向量运算的关联规则挖掘方法,其特征在于,所述定义对象和属性的向量表示,约定对象向量和属性向量的运算规则包括:定义信息系统I表示为:I=(U,A,f),U表示对象集、A表示属性集,其中U={u1,…,un},A={a1,…,am},un表示对象集中第n个元素、am表示属性集中第m个元素;
f称为I的信息函数,即f:U×A→{0,1},对任意(ui,aj)∈U×A,若f(ui,aj)=pij=
0,则称第i个对象ui不具有第j个属性aj;若f(ui,aj)=pij=1,则称第i个对象ui具有第j个属性aj。
定义A1→A2为一条属性关联规则,其中,A1, 且 A1称为前件,A2称为后件;
定义ui=(pi1,...,pim)1×m,表示对象ui可表示为由0或1构成的m维行向量;
定义 表示属性aj可表示为由0或1构成的n维列向量;
约定如下向量运算规则,1оui=ui、0οui=11×m=(1,…,1)1×m、1οaj=aj、其中,(1,…,1)1×m表示元素全为1的m维行向量,表示元素全为1的n维列向量;
约定属性aj与(u1,…,un)之间的向量运算规则如下,约定属性ui与(a1,…,am)之间的向量运算规则如下,其中n,m,i,j均为正整数。
3.根据权利要求1所述的一种基于向量运算的关联规则挖掘方法,其特征在于,所述计算属性集上的向量基为:定义B(aj)表示属性aj可生成一个向量基,得到属性集上的向量基为,
B(A)={B(aj)|aj∈A},
其中n,j均为正整数。
4.根据权利要求3所述的一种基于向量运算的关联规则挖掘方法,其特征在于,所述根据向量基计算生成属性集上的向量为:由J′对应的向量基生成的向量T(J′)表示为T(J′)=∨j∈J′B(aj),
其中J′是某一指标集,J′对应的向量基生成的所有向量记为其中m,j均为正整数。
5.根据权利要求4所述的一种基于向量运算的关联规则挖掘方法,其特征在于,所述根据所述属性集上的向量计算属性集上的任一向量的支持度为:任一向量T(J′)∈T(A)的支持度为:
S(T(J′))=(p′1j+p′2j+...+p′nj)/n,其中n,j均为正整数。
6.根据权利要求1-5任一项所述的一种基于向量运算的关联规则挖掘方法,其特征在于,所述根据预先设定的可信度阈值,在所述大于支持度阈值条件的向量中挖掘满足条件的属性关联规则包括:根据预先设定的关联规则的可信度阈值,在T(A)中挖掘大于可信度阈值的属性关联规则。
7.根据权利要求6所述的一种基于向量运算的关联规则挖掘方法,其特征在于,所述挖掘大于可信度阈值的属性关联规则为:在T(A)中选择两个向量,记为T(A1)和T(A2),其中,T(A1)表示由属性子集A1中所有元素对应的向量基确定的属性集上的向量,T(A2)表示由属性子集A2中所有元素对应的向量基确定的属性集上的向量。T(A1)和T(A2)中任一个向量为前件,另一个向量减去前件为后件,生成一条属性关联规则,即:T(A1)→(T(A2)-T(A1))或T(A2)→(T(A1)-T(A2))。
则生成属性关联规则的可信度为:
C(T(A1)→(T(A2)-T(A1)))=S(T(A1∪A2))/S(T(A1))或C(T(A2)→(T(A1)-T(A2)))=S(T(A1∪A2))/S(T(A2))。