1.一种基于支持向量机的混合特征选择的入侵检测方法,采用最优特征子集完成实时入侵检测,其特征在于:最优特征子集的获取包括:
S1:导入入侵检测数据集;
S2:采用数值标准化处理入侵检测数据集中的连续型特征,得到特征子集;
S3:对特征子集的参数进行初始化,得到最优特征;
S4:利用改进的GSA算法对高斯核SVM的惩罚参数和核函数进行优化,得到SVM分类器;
改进的GSA算法包括:将Tent混沌序列引入GSA算法中,利用Tent混沌序列对GSA算法中的输入数据进行初始化;在Tent混沌序列中引入随机变量 采用贝努利位移变换对Tent混沌序列的映射进行变换;在区间(0,1)内随机选取初值,将初值输入到变换后的Tent混沌序列映射中,并进行迭代,得到X序列;其中,Tent表示帐篷混沌序列,rand(.)表示随机选取一个数值,N表示序列内粒子的个数,X序列表示空间中的所有粒子的位置的集合;
高斯核SVM的惩罚参数C和高斯核核函数参数进行优化的过程包括:步骤1:根据Tent混沌序列在n维搜索空间中确定第i个粒子的位置为步骤2:初始化种群进行引力搜索算法中的所有参数;其参数包括种群大小N,最大迭代次数T,引力系数初始值G0,时间常数α,极小值常量ε以及常数a,粒子的初始速度步骤3:根据分类预测准确率确定适应度函数值;其中分类预测准确率为使用训练数据训练SVM模型后,采用测试集对SVM模型进行测试,得到分类预测准确率;
步骤4:更新种群粒子的万有引力系数G(t)、适应度函数值的最大值best(t)以及适应度函数值的最小值worst(t);
步骤5:计算t时刻,粒子i与粒子j的引力大小
步骤6:采用Logistic映射法计算kbest;
步骤7:根据引力大小 和kbest计算每个粒子的质量Mi(t)和加速度 通过引力搜索算法中的速度更新公式和位置更新公式依次更新粒子的速度和位置;
步骤8:根据对比更新前后粒子的位置向量对应适应度函数值,确定下一代粒子的位置;确定下一代粒子的位置规则为:若更新后的适应度函数值高于更新前,则替换原来的粒子;否则保留更新前的粒子;
步骤9:当迭代到最大值时,求得最终的粒子速度、位置以及平面最大间隔ω;
利用改进的引力搜索算法优化SVM的惩罚参数和核函数参数,两个参数是介于粒子本身就有位置的属性,则粒子的位置代表待优化的这两个参数;
其中,GSA表示引力搜索算法,Logistic表示逻辑斯特算法,kbest表示种群最优粒子的集合;
S5:利用SVM分类器对最优特征进行排序,得到优良子集;
S6:采用改进的引力搜书算法求取优良子集中的初始种群,根据初始种群得到指定特征空间的最优特征子集;
所述采用最优特征子集完成实时入侵检测包括:
将最优特征子集输入到入侵检测算法中,并采用改进的SVM作为分类器对待检测网络入侵数据进行分类,完成入侵检测;
其中,GSA表示引力搜索算法,SVM表示支持向量机。
2.根据权利要求1所述的一种基于支持向量机的混合特征选择的入侵检测方法,其特征在于,所述导入入侵检测数据包括特征向量和训练的样本集;
(1) (2) (i) (n) T
输入的特征向量为:x=(x ,x ,...,x ,...,x )训练的样本集为:T={(x1,y1),...(xi,yi),...(xN,yN)}(i)
其中,x 表示x的第i个特征,xi表示多个输入变量中的第i个,yi表示输入的第i个特征。
3.根据权利要求1所述的一种基于支持向量机的混合特征选择的入侵检测方法,其特征在于,所述采用数值标准化处理入侵检测数据集中的连续型特征包括:将连续数据转化为离散数据;其表达式为:(i)
其中, 表示第i个特征数值标准化后的值,x 表示x的第i个特征,μx表示训练集对应特征列的平均值,σx是对应特征列的标准差。
4.根据权利要求1所述的一种基于支持向量机的混合特征选择的入侵检测方法,其特征在于,所述对入侵检测数据集中参数进行初始化的过程包括:S31:输入数据集、采样个数和阈值,其中,数据集为T={(x1,y1),...(xi,yi),...(xN,yN)};
S32:对于每个数据集,在xi的同类样本中寻找最近邻xi,nh样本,再从xi的异类样本中寻找最近邻xi,nm样本;
S33:求取相关量所对应的属性j的分量,即表达式为:S34:根据相关量所对应的属性j的分量的大小对特征子集中特征进行排序,得到最优特征;
其中,T表示输入的数据集,xi表示多个输入变量中的第i个,yi表示输入的第i个特征,表示样本xi在属性j上的取值, 表示同类样本中的邻近样本xi,nh在属性j上的取值,表示异类样本中的邻近样本xi,nm在属性j上的取值。
5.根据权利要求1所述的一种基于支持向量机的混合特征选择的入侵检测方法,其特征在于,所述速度更新公式为:位置更新公式为:
其中,randi为[0,1]之间的随机数,t表示时间,ω(t)表示惯性权重,c1表示平衡群体记忆性的值,pbest表示粒子个体经过的最好位置,c2表示平衡个体记忆性的值,qbest表示种群所经历的最好位置,a(t)表示加速度。
6.根据权利要求1所述的一种基于支持向量机的混合特征选择的入侵检测方法,其特征在于,平面最大间隔ω的表达式为:其中,max_it为迭代总次数。
7.根据权利要求1所述的一种基于支持向量机的混合特征选择的入侵检测方法,其特征在于,所述优化的SVM递归特征消除对最优特征进行排序的步骤包括:S51:对当前特征子集Current_M包含的特征进行递归特征消除,得到特征子集Best_M为空;
S52:设定每次删除的特征数量比例S%;
S53:根据当前特征子集Current_M建立支持向量机分类模型,模型的表达式为:α=SVM‑train(Y,X,c,λ)
S54:将当前特征子集Current_M输入到支持向量机分类模型中,得到平面最大间隔ω的值;
2
S55:根据平面最大间隔的绝对值的平方|ω|的值对当前特征子集Current_M中的特征进行降序排列;
S56:移除排序后的排在末尾的S%个特征,得到优良子集;
其中,α表示SVM训练得到的模型,Y表示标志位,X代表输入的数据,c表示惩罚参数,λ表示高斯核函数参数,SVM‑train(.)表示支持向量机模型的计算过程。
8.根据权利要求1所述的一种基于支持向量机的混合特征选择的入侵检测方法,其特征在于,所述得到指定特征空间的最优特征子集的过程包括:将递归特征消除得到的排序的特征通过优化过参数的支持向量机,对特征数量按排序的特征依次增加,比较预测准确率,其中准确率越高,则该特征子集为最优特征子集。