欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2019112911446
申请人: 重庆邮电大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-11-14
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种类不平衡的网络流量分类方法,其特征在于,所述方法包括:

获取待分类的网络流量数据,并提取出网络流量的特征;

采用特征选择算法删除不相关特征以及冗余特征,并对剩余的特征降维,从而选择出最优特征子集;

将所述最优特征子集输入至基于权重的多分类器中,采用增量学习的方式,进行网络流量分类训练,优化分类器性能后,对网络流量进行分类。

2.根据权利要求1所述的一种类不平衡的网络流量分类方法,其特征在于,所述提取出网络流量的统计特征包括从TCP协议头提取,采集该网络流量所属类别信息和属性特征信息。

3.根据权利要求1所述的一种类不平衡的网络流量分类方法,其特征在于,最优特征子集的获取方式包括依次利用加权不确定性删除网络流量中的不相关特征;利用近似马尔科夫毯删除冗余特征;获得候选特征集合;基于相关性度量的特征评估函数以及序列搜索算法降低候选特征集合的维数;从而确定出最优特征子集。

4.根据权利要求3所述的一种类不平衡的网络流量分类方法,其特征在于,所述候选特征集合的获取方式包括将网络流量中的各个特征初始化;利用加权对称不确定性公式计算出网络流量类别与每一属性特征之间的相关度,将相关度值与相关度门限阈值进行比较,若小于相关度门限阈值,则删除该属性特征;否则利用马尔科夫毯条件的判定公式,删除具有近似马尔科夫毯的冗余特征;直至输出候选特征集合;

加权对称不确定性公式包括:

WSU(F,C)表示网络流量类别C与属性特征F的相关度;Hw(C)表示网络流量类别C的加权熵;Hw(F)表示属性特征F的加权熵;IGw(C|F)表示网络流量类别C与属性特征F加权互信息;

马尔科夫毯条件的判定公式包括:

当满足该判定公式,则将属性特征fj作为冗余特征删除;

其中,WSU(fi,C)表示网络流量类别C与属性特征fi的相关度;WSU(fj,C)表示网络流量类别C与属性特征fj的相关度;WSU(fi,fj)表示属性特征fi与属性特征fj的相关度。

5.根据权利要求3所述的一种类不平衡的网络流量分类方法,其特征在于,所述降低候选特征集合的维度的方式包括:步骤1:计算候选特征集合BS(f1,f2,…,fn)中每一个属性特征fd的特征评估函数值J(fd);

步骤2:若J(fa)=max{J(fd)},则把属性特征fa加入集合Fo,并将属性特征fa从候选特征集合中删除;

步骤3:将候选特征集合中未入选的属性特征分别与集合Fo中的属性特征进行匹配,得到匹配后组合特征集的评估函数值;

步骤4:将最大组合特征评估函数值对应的属性特征加入集合Fo,并将该属性特征从集合候选特征集合中删除;

步骤5:判断集合Fo中属性特征的数量是否达到预设数量阈值L,如达到,转至步骤6,否则,转至步骤4;

步骤6:输出最终的集合Fo作为最优特征子集。

6.根据权利要求1所述的一种类不平衡的网络流量分类方法,其特征在于,所述基于权重的多分类器中包括从预先获取的特征子集上训练所得一个基分类器;通过增量学习的方式,将新增的网络流量及其通过基分类器所得的分类结果作为新的特征子集;若新的特征子集与前一阶段特征子集相比,发生了概念漂移并达到一定程度时,则新增基分类器,采用新的特征子集训练新增的基分类器,参与预测下一阶段的网络流量的分类结果。

7.一种类不平衡的网络流量分类装置,其特征在于,包括:

数据流采集模块,用于采集待分类的网络数据流量;

特征选择模块,用于删除网络数据流量中不相关特征和冗余特征,并对选择出的剩余特征降维;

基于权重的多分类器,用于根据输入的最优特征子集,对网络流量分类训练,优化分类器性能后,对网络流量进行分类。

8.根据权利要求7所述的一种类不平衡的网络流量分类装置,其特征在于,所述特征选择模块包括加权不确定性计算单元、近似马尔科夫毯判定单元、移除单元、特征评估函数计算单元以及序列搜索单元;所述加权不确定性计算利用计算出的加权不确定性相关度值确定出网络流量中相关性较大的属性特征;所述近似马尔科夫毯判定单元用于根据加权不确定性单元计算出的相关度值,确定出具有马尔科夫毯关系的属性特征;所述移除单元用于移除加权不确定性计算单元和近似马尔科夫毯判定单元所确定的属性特征;所述特征评估函数计算单元用于计算每个属性特征的特征评估函数值以及匹配后组合特征集的评估函数值;所述序列搜索单元用于根据组合特征的准则函数值进行排序,输出降维后的特征。

9.根据权利要求7所述的一种类不平衡的网络流量分类装置,其特征在于,所述基于权重的多分类器包括多个基分类器,每个基分类器被赋予一个权重值,通过加权求和的方式,获取待测的网络流量的分类结果。

10.一种计算机设备,其特征在于,包括存储器,处理器以及存储在处理器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如权利要求1~6任一所述的方法。