1.一种基于特征权重的网络数据相似度计算方法,其特征在于,所述方法包括以下步骤:S1、构建网络数据参数:构建网络数据特征值和网络数据特征的权重向量;
S2、网络数据数值化转换:将所述网络数据特征值转化为网络数据特征的十进制数值并赋值给网络数据特征的数值化向量,构建数值化的网络数据集;
所述步骤S2的具体过程如下:
S21、定义网络数据特征的数值化形式:构建网络数据特征的数值化向量的数据结构;
构建网络数据特征的数值化向量的数据结构DDi=
S22、二进制数值化形式的网络特征的数值化转换:将网络数据特征向量中的二进制数值化形式的网络特征的二进制数值转换为十进制数值;
S23、字符形式的网络特征的数值化转换:将网络数据特征向量中的字符形式的网络特征的二进制数值转换为十进制数值;
S24、源IP地址的网络特征的数值化转换:将源IP地址的4组分段数字分别转换为十进制数值;
S241、获取源IP地址的4组分段数字;
S242、将源IP地址的4组分段数字分别转换为十进制数值,并分别赋值给dsIP1,dsIP2,dsIP3,dsIP4;
S25、目的IP地址的网络特征的数值化转换:将目的IP地址的4组分段数字分别转换为十进制数值;
S251、获取目的IP地址的4组分段数字;
S252、将目的IP地址的4组分段数字分别转换为十进制数值,并分别赋值给ddIP1,ddIP2,ddIP3,ddIP4;
S26、给数值化向量赋值:将所有网络特征的十进制数值赋值给所述网络数据特征的数值化向量的相应字段;
S27、构建数值化的网络数据集:将所有所述网络数据特征的数值化向量组合为数值化的网络数据集;
S3、计算网络特征数据相似度:构建网络特征数据的相似度向量的数据结构,根据所述网络数据特征的数值化向量,计算网络特征数据的相似度值,并将这些相似度值赋给网络特征数据的相似度向量的相应字段;
所述步骤S3的具体过程如下:
S31、构建网络特征数据的相似度向量:对于两个网络数据特征的数值化向量ddx和ddy,构建网络特征数据的相似度向量;
S32、计算二进制数值化形式的网络特征数据的相似度;
利用如下公式计算二进制数值化形式的网络特征数据的相似度值sbj:其中,1≤j≤p,该公式意为两个网络数据特征的数值化向量ddx和ddy的二进制数值化形式的网络特征数据的差的绝对值除以其和;
S33、计算字符形式的网络特征数据的相似度;
利用如下公式计算字符形式的网络特征数据的相似度值sck:其中,1≤k≤q,该公式意为两个网络数据特征的数值化向量ddx和ddy的字符形式的网络特征数据的差的绝对值除以其和;
S34、计算源IP地址的网络特征数据的相似度;
利用如下公式计算源IP地址的网络特征数据的相似度值:其中,dsIPr表示两个网络数据特征的数值化向量ddx和ddy的源IP地址的4组分段数字的十进制数值;
S35、计算目的IP地址的网络特征数据的相似度;
利用如下公式计算源IP地址的网络特征数据的相似度值:其中,ddIPr表示两个网络数据特征的数值化向量ddx和ddy的目的IP地址的4组分段数字的十进制数值;
S36、将计算出的所有网络特征数据的相似度赋值给网络特征数据的相似度向量;
S4、计算网络数据总体相似度:根据所述网络数据特征的权重向量和所述网络特征数据的相似度向量,计算两个网络数据特征的数值化向量之间的总体相似度;
S5、网络数据相似等级转换:构建网络特征数据相似等级与相似度之间的对应关系,将所述网络特征数据的相似度值转换为相似等级。
2.根据权利要求1所述的一种基于特征权重的网络数据相似度计算方法,其特征在于,所述步骤S1的具体过程如下:S11、构建网络数据特征值;
S12、构建网络数据特征的权重向量。
3.根据权利要求1所述的一种基于特征权重的网络数据相似度计算方法,其特征在于,所述步骤S4的具体过程如下:S41、读取S12步骤中网络数据特征的权重向量;
S42、读取S3步骤中构建的网络特征数据的相似度向量;
S43、根据所述网络数据特征的权重向量和所述网络特征数据的相似度向量,计算两个网络数据特征的数值化向量ddx和ddy之间的总体相似度。
4.根据权利要求1所述的一种基于特征权重的网络数据相似度计算方法,其特征在于,所述步骤S5的具体过程如下:S51、构建两个网络数据之间的相似等级;
S52、构建网络数据相似等级与相似度之间的对应关系;
S53、根据S52步骤中构建的对应关系,确定两个网络数据的相似度值对应的相似等级。
5.根据权利要求1所述的一种基于特征权重的网络数据相似度计算方法,其特征在于,所述网络数据及其相似度计算参数的规范模块中构建的网络特征,包括但不限于网络数据包头的字段和从网络数据包内容中抽取的特征。
6.一种基于特征权重的网络数据相似度计算系统,其特征在于,包括网络数据及其相似度计算参数的规范模块(1)、与所述网络数据及其相似度计算参数的规范模块(1)依次连接的网络数据数值化转换模块(2)、网络特征数据相似度计算模块(3)、网络数据总体相似度计算模块(4)和网络数据相似等级转换模块(5);
其中,所述网络数据及其相似度计算参数的规范模块(1)用于提供数据变量;
所述网络数据数值化转换模块(2),用于将网络数据的特征值转换为十进制数值;
所述网络特征数据相似度计算模块(3),计算每个网络数据特征的十进制相似度数值;
所述网络数据总体相似度计算模块(4)与所述网络数据及其相似度计算参数的规范模块(1)连接,用于计算网络数据总体相似度的十进制数值;
所述网络数据相似等级转换模块(5),用于规范网络数据相似的等级,并将相似度数值转换为相似等级;
网络数据数值化转换:
S21、定义网络数据特征的数值化形式:构建网络数据特征的数值化向量的数据结构;
构建网络数据特征的数值化向量的数据结构DDi=
S22、二进制数值化形式的网络特征的数值化转换:将网络数据特征向量中的二进制数值化形式的网络特征的二进制数值转换为十进制数值;
S23、字符形式的网络特征的数值化转换:将网络数据特征向量中的字符形式的网络特征的二进制数值转换为十进制数值;
S24、源IP地址的网络特征的数值化转换:将源IP地址的4组分段数字分别转换为十进制数值;
S241、获取源IP地址的4组分段数字;
S242、将源IP地址的4组分段数字分别转换为十进制数值,并分别赋值给dsIP1,dsIP2,dsIP3,dsIP4;
S25、目的IP地址的网络特征的数值化转换:将目的IP地址的4组分段数字分别转换为十进制数值;
S251、获取目的IP地址的4组分段数字;
S252、将目的IP地址的4组分段数字分别转换为十进制数值,并分别赋值给ddIP1,ddIP2,ddIP3,ddIP4;
S26、给数值化向量赋值:将所有网络特征的十进制数值赋值给所述网络数据特征的数值化向量的相应字段;
S27、构建数值化的网络数据集:将所有所述网络数据特征的数值化向量组合为数值化的网络数据集;
计算网络特征数据相似度:
S31、构建网络特征数据的相似度向量:对于两个网络数据特征的数值化向量ddx和ddy,构建网络特征数据的相似度向量;
S32、计算二进制数值化形式的网络特征数据的相似度;
利用如下公式计算二进制数值化形式的网络特征数据的相似度值sbj:其中,1≤j≤p,该公式意为两个网络数据特征的数值化向量ddx和ddy的二进制数值化形式的网络特征数据的差的绝对值除以其和;
S33、计算字符形式的网络特征数据的相似度;
利用如下公式计算字符形式的网络特征数据的相似度值sck:其中,1≤k≤q,该公式意为两个网络数据特征的数值化向量ddx和ddy的字符形式的网络特征数据的差的绝对值除以其和;
S34、计算源IP地址的网络特征数据的相似度;
利用如下公式计算源IP地址的网络特征数据的相似度值:其中,dsIPr表示两个网络数据特征的数值化向量ddx和ddy的源IP地址的4组分段数字的十进制数值;
S35、计算目的IP地址的网络特征数据的相似度;
利用如下公式计算源IP地址的网络特征数据的相似度值:其中,ddIPr表示两个网络数据特征的数值化向量ddx和ddy的目的IP地址的4组分段数字的十进制数值;
S36、将计算出的所有网络特征数据的相似度赋值给网络特征数据的相似度向量。
7.根据权利要求6所述的一种基于特征权重的网络数据相似度计算系统,其特征在于,所述网络数据及其相似度计算参数的规范模块(1)通过构建网络数据特征值和网络数据特征的权重向量来提供数据变量。
8.根据权利要求7所述的一种基于特征权重的网络数据相似度计算系统,其特征在于,所述网络数据总体相似度计算模块(4)根据网络数据特征值和网络数据特征的权重来计算网络数据总体相似度。