1.一种文件扫描方法,其特征在于,所述方法包括:
利用M个第一模型分别判断待检测文件的类型,以获得M个判断结果,M为大于或者等于
2的整数;
依据所述M个判断结果,获得将所述待检测文件判定为恶意文件的第一模型的数目;
依据所述将所述待检测文件判定为恶意文件的第一模型的数目,获得所述待检测文件的类型;
所述方法还包括:获得新出现的恶意文件,以作为训练样本;利用所述训练样本进行机器训练,以生成第二模型;利用所述第二模型对所述M个第一模型进行调整,包括:所述M个第一模型组成第一集合,将所述第二模型添加到预设的第二集合,所述第二集合包含K个第二模型,K为大于0的整数;
依据所述第二集合中的一个第二模型以及所述第一集合中的一个第一模型,生成P个模型组,P大于0且小于或者等于M与K的乘积;利用每个所述模型组中的第二模型,在所述第一集合中替换属于该模型组的第一模型,以获得P个第三集合;
获得每个所述第三集合的恶意文件检出率和恶意文件错误率;依据每个所述第三集合的恶意文件检出率和恶意文件错误率,选出一个所述第三集合;
利用选出的所述第三集合对应的模型组中的第二模型对所述第一集合进行调整。
2.根据权利要求1所述的方法,其特征在于,所述依据所述将所述待检测文件判定为恶意文件的第一模型的数目,获得所述待检测文件的类型,包括:比较将所述待检测文件判定为恶意文件的第一模型的数目与预设的第一阈值的大小;
若将所述待检测文件判定为恶意文件的第一模型的数目小于所述第一阈值,确定所述待检测文件为正常文件;
若将所述待检测文件判定为恶意文件的第一模型的数目大于或者等于所述第一阈值,确定所述待检测文件为恶意文件。
3.根据权利要求1所述的方法,其特征在于,所述利用选出的所述第三集合对应的模型组中的第二模型对所述第一集合进行调整,包括:比较选出的所述第三集合的恶意文件检出率与所述第一集合的恶意文件检出率的大小,以及比较选出的所述第三集合的恶意文件错误率与所述第一集合的恶意文件错误率的大小;
若选出的所述第三集合的恶意文件检出率大于所述第一集合的恶意文件检出率,且选出的所述第三集合的恶意文件错误率小于所述第一集合的恶意文件错误率,利用所述第三集合对应的模型组中的第二模型,在所述第一集合中替换属于该模型组的第一模型,或者,在所述第一集合中增加所述第三集合对应的模型组中的第二模型。
4.一种文件扫描装置,其特征在于,所述装置包括:
类型判断单元,用于利用M个第一模型分别判断待检测文件的类型,以获得M个判断结果,M为大于或者等于2的整数;
结果统计单元,用于依据所述M个判断结果,获得将所述待检测文件判定为恶意文件的第一模型的数目;
类型确定单元,用于依据所述将所述待检测文件判定为恶意文件的第一模型的数目,获得所述待检测文件的类型;
所述装置还包括:
文件获取单元,用于获得新出现的恶意文件,以作为训练样本;
模型生成单元,用于利用所述训练样本进行机器训练,以生成第二模型;
模型调整单元,用于利用所述第二模型对所述M个第一模型进行调整;
所述M个第一模型组成第一集合;所述模型调整单元,具体用于:将所述第二模型添加到预设的第二集合,所述第二集合包含K个第二模型,K为大于0的整数;
依据所述第二集合中的一个第二模型以及所述第一集合中的一个第一模型,生成P个模型组,P大于0且小于或者等于M与K的乘积;
利用每个所述模型组中的第二模型,在所述第一集合中替换属于该模型组的第一模型,以获得P个第三集合;
获得每个所述第三集合的恶意文件检出率和恶意文件错误率;
依据每个所述第三集合的恶意文件检出率和恶意文件错误率,选出一个所述第三集合;
利用选出的所述第三集合对应的模型组中的第二模型对所述第一集合进行调整。
5.根据权利要求4所述的装置,其特征在于,所述类型确定单元,具体用于:比较将所述待检测文件判定为恶意文件的第一模型的数目与预设的第一阈值的大小;
若将所述待检测文件判定为恶意文件的第一模型的数目小于所述第一阈值,确定所述待检测文件为正常文件;
若将所述待检测文件判定为恶意文件的第一模型的数目大于或者等于所述第一阈值,确定所述待检测文件为恶意文件。
6.根据权利要求4所述的装置,其特征在于,所述模型调整单元用于利用选出的所述第三集合对应的模型组中的第二模型对所述第一集合进行调整时,具体用于:比较选出的所述第三集合的恶意文件检出率与所述第一集合的恶意文件检出率的大小,以及比较选出的所述第三集合的恶意文件错误率与所述第一集合的恶意文件错误率的大小;
若选出的所述第三集合的恶意文件检出率大于所述第一集合的恶意文件检出率,且选出的所述第三集合的恶意文件错误率小于所述第一集合的恶意文件错误率,利用所述第三集合对应的模型组中的第二模型,在所述第一集合中替换属于该模型组的第一模型,或者,在所述第一集合中增加所述第三集合对应的模型组中的第二模型。