欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2020108729176
申请人: 重庆理工大学
专利类型:发明专利
专利状态:已下证
专利领域: 电通信技术
更新日期:2024-02-28
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于字符级滑动窗口和深度残差网络的DGA域名检测系统,其特征在于,包括获取预处理模块、原始特征提取处理模块、特征提取模块、批标准化处理模块、域名分类模块和数据展示模块;

所述获取预处理模块的数据输出端与原始特征提取处理模块的数据输入端相连,原始特征提取处理模块的数据输出端与特征提取模块的数据输入端相连,特征提取模块的数据输出端与批标准化处理模块的数据输入端相连,批标准化处理模块的数据输出端与域名分类模块的数据输入端相连,域名分类模块的数据输出端与数据展示模块的数据输入端相连;

所述获取预处理模块用于获取域名数据,对获取的域名数据作为待处理数据,对待处理数据进行预处理;在所述获取预处理模块中对待处理数据进行预处理包括以下步骤:S11,对域名进行数值化处理,使用字符级词典把域名中每个字符映射成one‑hot编码向量;

S12,将one‑hot编码向量的V1维度向量映射成d维度;

所述原始特征提取处理模块用于对所述获取预处理模块中处理后的数据进行原始特征提取处理;在原始特征提取处理模块中包括:定义 为一条DGA域名样本中第i个字符的字符向量;那么使用 代表输入的DGA域名;

然后定义k为滤波器的长度,引入 作为一个卷积滤波器感受野大小;对于句子中的每个位置j,都有一个带有k个连续字符向量的窗口向量wj,表示为:wj=[aj,aj+1,...,aj+k‑1],然后滤波器m以’VALID’方式与每个位置窗口向量进行卷积,生成特征图 窗口向量wj的特征图的每个元素Aj的产生如下:Aj=f(wj⊙m+b),对于长度相同n个滤波器,可生成n个特征图为每个窗口向量wj特征进行表示,W=[A1,A2,...,An];

所述特征提取模块用于对所述原始特征提取处理模块中处理后的数据进行更深层次的特征提取;在所述特征提取模块中包括:xl=x′l‑1+H(xl‑1),其中,x′l‑1表示xl‑1经过下采样后得到的值;

xl‑1表示第l‑1层残差块的输入;

H(xl‑1)表示两层卷积层进行特征提取得到结果;

xl表示残差块第l层的输入;

所述批标准化处理模块用于对所述特征提取模块中处理后的数据进行批标准化处理;

在所述批标准化处理模块中批标准化的计算方法为:计算一个mini‑batch大小的样本均值:其中,m表示输入样本的个数;

xi表示输入的第i样本;

μB表示样本均值;

计算一个mini‑batch大小样本方差:其中,m表示输入样本的个数;

xi表示输入的第i样本;

μB表示样本均值;

σB表示样本方差;

对输入的第i样本xi归一化:其中,xi表示输入的第i样本;

μB表示样本均值;

σB表示样本方差;

ε表示拟合参数;

表示归一化值;

其中,γ表示第一训练参数;

表示归一化值;

β表示第二训练参数;

yi表示经过Batch Normalization后得到值;

所述域名分类模块用于对域名进行分类;在域名分类模块中,分类方法为:若S(x)>=0.5,表示置信度x为DGA域名;

若S(x)<0.5,表示置信度x为合法的域名;

所述数据展示模块用于展示所述域名分类模块的结果。

2.根据权利要求1所述的基于字符级滑动窗口和深度残差网络的DGA域名检测系统,其特征在于,在展示模块上还包括展示该系统的衡量指标值,该衡量指标值包括准确率、查准率、召回率之一或者任意组合;

其准确率的计算方法为:其中,TP表示实际DGA归类为DGA;

TN表示实际合法记录归类为合法记录;

FP表示实际的合法记录被归类为DGA;

FN表示实际的DGA被归类为合法记录;

Acc表示准确率;

其查准率的计算方法为:TP表示实际DGA归类为DGA;

其中,FP表示实际的合法记录被归类为DGA;

precision表示查准率;

其召回率的计算方法为:其中,TP表示实际DGA归类为DGA;

FN表示实际的DGA被归类为合法记录;

recall表示召回率。