欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2020108729157
申请人: 重庆理工大学
专利类型:发明专利
专利状态:已下证
专利领域: 电通信技术
更新日期:2024-02-23
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种融合字符级滑动窗口和深度残差网络的DGA域名检测方法,其特征在于,包括以下步骤:

S1,获取域名数据,将获取的域名数据作为待处理数据,对待处理数据进行预处理;

S2,对步骤S1中处理后的数据进行原始特征提取处理;在步骤S2具体包括:定义 为一条DGA域名样本中第i个字符的字符向量;其中,d表示字符向量的维度;

那么使用 代表输入的DGA域名;其中,L表示DGA域名的长度;

然后定义k为滤波器的长度,滤波器的长度为多个不同尺寸的滤波器,引入 作为一个卷积滤波器感受野大小;对于句子中的每个位置j,都有一个带有k个连续字符向量的窗口向量wj,k个连续字符向量的窗口向量wj为多尺寸滑动窗口,表示为:wj=[aj,aj+1,...,aj+k‑1],其中,wj表示k个连续字符向量的窗口向量;

aj表示一条DGA域名样本中第j个字符的字符向量;

aj+1表示一条DGA域名样本中第j+1个字符的字符向量;

aj+k‑1表示一条DGA域名样本中第j+k‑1个字符的字符向量;

然后滤波器m以’VALID’方式与每个位置窗口向量进行卷积,生成特征图 窗口向量wj的特征图的每个元素Aj的产生如下:Aj=f(wj⊙m+b),其中,Aj表示窗口向量wj的特征图的每个元素;

f()是非线性的激活函数;

wj表示k个连续字符向量的窗口向量;

⊙表示逐元素相乘;

m表示一个卷积滤波器感受野大小;

b是偏置项;

对于长度相同的n个滤波器,可生成n个特征图为每个窗口向量wj特征进行表示,W=[A1,A2,...,An];

其中,W表示n个滤波器生成的特征图;

A1表示第1个滤波器产生的特征图;

A2表示第2个滤波器产生的特征图;

An表示第n个滤波器产生的特征图;

S3,对步骤S2中处理后的数据输入到深度残差网络层进行更深层次的特征提取;利用深度残差网络层进行特征提取的计算方法为:xl=x′l‑1+H(xl‑1),其中,x′l‑1表示xl‑1经过下采样后得到的值;

xl‑1表示第l‑1层残差块的输入;

H(xl‑1)表示两层卷积层进行特征提取得到结果;

xl表示残差块第l层的输入;

S4,对其域名进行分类。

2.根据权利要求1所述的融合字符级滑动窗口和深度残差网络的DGA域名检测方法,其特征在于,在步骤S1中对待处理数据进行预处理包括以下步骤:S11,对域名进行数值化处理,使用字符级词典把域名中每个字符映射成one‑hot编码向量;

S12,将one‑hot编码向量的V1维度向量映射成d维度。

3.根据权利要求1所述的融合字符级滑动窗口和深度残差网络的DGA域名检测方法,其特征在于,在步骤S4中,分类的计算方法为:若S(x)>=0.5,表示置信度x为DGA域名;

若S(x)<0.5,表示置信度x为合法的域名。

4.根据权利要求1所述的融合字符级滑动窗口和深度残差网络的DGA域名检测方法,其特征在于,分类的计算方法也可以为:其中,T表示矩阵的转置;

ζj表示softmax函数的权重;

K表示多分类的类别数量;

P(y=j|x)表示样本向量x属于第j类DGA家族的概率;

若P(y=1|x)的概率最大,则置信度x属于第1类DGA家族;

若P(y=2|x)的概率最大,则置信度x属于第2类DGA家族;

若P(y=3|x)的概率最大,则置信度x属于第3类DGA家族;

……;

若P(y=K|x)的概率最大,则置信度x属于第K类DGA家族。

5.根据权利要求1所述的融合字符级滑动窗口和深度残差网络的DGA域名检测方法,其特征在于,在步骤S2中或/和步骤S3中还包括对数据进行批标准化处理,其批标准化处理的计算方法为:

计算一个mini‑batch大小的样本均值:其中,表示输入样本的个数;

xi表示输入的第i样本;

μB表示样本均值;

计算一个mini‑batch大小样本方差:其中,表示输入样本的个数;

xi表示输入的第i样本;

μB表示样本均值;

σB表示样本方差;

对输入的第i样本xi归一化:其中,xi表示输入的第i样本;

μB表示样本均值;

σB表示样本方差;

ε表示拟合参数;

表示归一化值;

其中,γ表示第一训练参数;

表示归一化值;

β表示第二训练参数;

yi表示经过Batch Normalization后得到值。

6.根据权利要求1所述的融合字符级滑动窗口和深度残差网络的DGA域名检测方法,其特征在于,还包括对该方法进行损失值计算,其损失值的计算方法为:其中,B表示 训练样本一个mini‑batch数量;

(i)

y 表示第i个样本的标签值;

(i)

hθ(x )表示模型预测的值;

(i)

x 表示第i个样本的值。

7.根据权利要求1所述的融合字符级滑动窗口和深度残差网络的DGA域名检测方法,其特征在于,还包括对该方法进行指标衡量,其指标衡量包括准确率、查准率、召回率之一或者任意组合;

其准确率的计算方法为:其中,TP表示实际DGA归类为DGA;

TN表示实际合法记录归类为合法记录;

FP表示实际的合法记录被归类为DGA;

FN表示实际的DGA被归类为合法记录;

Acc表示准确率;

其查准率的计算方法为:TP表示实际DGA归类为DGA;

其中,FP表示实际的合法记录被归类为DGA;

precision表示查准率;

其召回率的计算方法为:其中,TP表示实际DGA归类为DGA;

FN表示实际的DGA被归类为合法记录;

recall表示召回率。