欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2017105474277
申请人: 长沙学院
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-01-05
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于半监督学习的入侵检测方法,其特征在于实施步骤包括:1)选取初始包含带标签样本和待测试的未标记样本的混合样本集;2)针对混合样本集进行数据预处理,得到离散化的训练数据样本;3)基于离散化的训练数据样本计算特征空间中各个特征值的信息增益,计算各个特征值的信息增益的函数表达式如式(1)所示;式(1)中,IG(t)为特征值t的信息增益,m为特征总数,P(ci)为第i个特征值ci的出现频率,t和分别为特征值t的存在和不存在,P(t)为特征值t存在的概率,P(ci|t)为出现特征t

时第i个特征值ci出现的概率,为特征值t不存在的概率,为不出现特征t时第i

个特征值ci出现的概率;4)对各个特征值的信息增益进行排序,根据预设的阈值将信息增益小于预设的阈值的特征将从特征空间中去除以完成信息熵的特征选择;5)基于信息熵的特征选择对带标签样本进行筛选,将筛选得到的新的训练数据用于基于LapSVM的分类器半监督训练;6)将完成半监督训练的分类器对待测试的未标记样本进行分类;7)计算入侵检测的检测指标的评估值,包括检测率、召回率、错误率和假阳性率,其中检测率的计算函数表达式如式(4)所示,召回率的计算函数表达式如式(5)所示,错误率的计算函数表达式如式(6)所示,假阳性率的计算函数表达式如式(7)所示;

式(4)中,Precision为检测率,TP为正确检测到异常连接的次数,FP为正常连接被错误地检测为异常的次数;

式(5)中,Recall为召回率,TP为正确检测到异常连接的次数,FN为异常连接被错误地检测为正常连接的次数;

式(6)中,Error_Rate为错误率,FP为正常连接被错误地检测为异常的次数,FN为异常连接被错误地检测为正常连接的次数,TP为正确检测到异常连接的次数,TN为正常连接被正确检测的次数;

式(7)中,FPR为假阳性率,FP为正常连接被错误地检测为异常的次数,TN为正常连接被正确检测的次数;8)判断检测指标的评估值是否达到设定阈值,如果未达到设定阈值,则重新设定用于完成信息熵的特征选择的预设的阈值,跳转执行步骤4);否则,跳转执行步骤9);

9)判断对对待测试的未标记样本进行分类的分类次数是否超出预设阈值,如果尚未预设阈值,则重新设定用于完成信息熵的特征选择的预设的阈值,跳转执行步骤4);否则,针对所有对待测试的未标记样本进行分类的检测指标确定最佳的检测指标的评估值,将最佳的检测指标的评估值对应的对带初始标签的训练数据样本进行分类的分类结果输出。2.根据权利要求1所述的基于半监督学习的入侵检测方法,其特征在于,步骤2)的详细步骤包括:2.1)针对混合样本集中的带标签样本,如果该带标签样本的网络连接记录是正常的网络连接记录则设网络连接记录的标签为1;否则如果是攻击类型则设网络连接记录的标签为-1;针对混合样本集中的未标记样本,设网络连接记录的标签为0;2.2)针对设置网络连接记录标签后的混合样本集,将所有样本的字符类型数据转换成数字类型,然后对于取值范围较大的数据类型进行归一化处理,最后将全部连续数据类型离散化处理,得到离散化的训练数据样本。3.根据权利要求1所述的基于半监督学习的入侵检测方法,其特征在于,步骤5)的详细步骤包括:5.1)针对l个带标签样本、u个待测试的未标记样本,计算节点之间的欧氏距离,利用k最近邻方法构造l+u个节点的数据邻接图,数据邻接图中每一个节点xi分别通过边连接到它的k个最近邻,且边的权值Wij取值0或1;5.2)选择核函数K(x,y),利用核函数K(x,y)计算训练样本的格拉姆矩阵K;5 .3)根据L=W-D计算拉普拉斯图的邻接图L,其中W为n维的邻接矩阵,D为n维对角矩阵,且Wij为节点i和j之间的边的权值;

5.4)选择训练参数γA和γI,利用与标准SVM相同的求解策略,引入拉格朗日算子,构造拉格朗日函数求解最优解膨胀系数向量α*如式(2)所示;

式(2)中,α*为最优解膨胀系数向量,γA和γI为训练参数,I为l+u维的单位矩阵,l为带标签样本数量,u为待测试的未标记样本数量,L为拉普拉斯图的邻接图,K为由带标签样本和未标记样本组成的l+u维格拉姆矩阵;J为一个l+u维的对角矩阵,当xi是标记样本时,对角矩阵中的元素Jii=1,否则Jii=0;Y为l+u维的对角矩阵,对角矩阵Y中的前l个元素为带标记样本的标签、后u个元素为0;β*为引入的拉格朗日算子;5.5)输出如式(3)所示函数作为完成半监督训练的分类器,f(x)=∑α*K(xi,x)   i=1,……,l+u    (3)式(3)中,f(x)为分类器,α*为最优解膨胀系数向量,K(xi,x)为选取的核函数,l为带标签样本数量,u为待测试的未标记样本数量。4.根据权利要求3所述的基于半监督学习的入侵检测方法,其特征在于,步骤6)将完成半监督训练的分类器对带初始标签的训练数据样本进行分类具体是指利用符号函数sgn( )对于分类器f(x)从l+1至l+u维数据进行计算,完成对u个待测试的未标记样本的分类。