1.一种基于字节码图像聚类的Android恶意代码家族分类方法,其特征在于:所述分类方法包括如下步骤:
1)APK程序代码映射成灰度图像
将Android恶意APK格式的文件中的DEX文件提取出来,该DEX文件包含了Dalvik字节码,所述Dalvik字节码能被Dalvik虚拟机执行;将字节码构建成一个像素点矩阵,矩阵中的像素点为一个字节,取值范围从0x00至0xFF,即有256种取值,对应256阶的灰度,由像素矩阵生成png格式的灰度图;
2)灰度图像的特征提取
利用GIST算法提取步骤1)生成的灰度图的特征过程如下:
2.1).首先按照原始图像的像素点总数,通过计算得到一个高度与宽度等长的像素点矩阵,该矩阵存放的仍是原始图像的像素点,并可利用矩阵生成一个正方形图像;
2.2).然后对每个子区域进行8个方向与4个尺度的小波滤波来提取图像的纹理特征信息;
2.3).每一幅图像最终获得一个16×8×4=512维特征向量;
将得到的高维数据进行降维与数据可视化;
3)基于灰度图像特征的分类
使用随机森林算法对特征进行分类,通过对灰度图像的聚类完成对Android恶意代码家族的分类。