1.一种数字信息批量处理方法,其特征在于:该方法包括以下步骤:
步骤S1、当手机内存占用率达到70%时,数据信息批量处理系统启动,定期扫描手机内存,收集内存中的文件和数据信息;
步骤S2、获取收集到的文件和数据信息,对文件和数据信息进行整理;
步骤S3、逐一扫描文件,进行一级筛选标准制定,删除未达到一级标准的文件和数据信息;
步骤S4、当手机内存占用率达到90%时,进一步进行二级筛选标准制定,删除未达到二级标准的文件和数据信息,同时,保留达到二级标准的文件和数据信息,即使手机内存已满。
2.根据权利要求1所述的一种数字信息批量处理方法,其特征在于:所述步骤S1进一步包括:系统模块负责定期扫描手机内存,遍历内存中的文件夹和文件,收集文件的相关信息,对于每个文件,收集文件的属性、内容、下载时间、使用频率、最后修改时间。
3.根据权利要求1所述的一种数字信息批量处理方法,其特征在于:所述步骤S2中的整理方法为:
通过文件属性记录文件名称,用于文件的标识和后续操作、文件大小、文件类型,针对特定文件类型,然后从文件的元数据中提取下载时间信息,接着统计文件的使用频率,记录文件被打开或调用的次数,最后从文件的元数据中提取最后修改时间信息,用于后续判断文件的展示信息量。
4.根据权利要求1所述的一种数字信息批量处理方法,其特征在于:所述步骤S3中一级筛选标准为:没有重复或相似度高的文件,以及没有历史操作遗留的无用文件。
5.根据权利要求4所述的一种数字信息批量处理方法,其特征在于:对于重复或相似度高的文件分析判断方法为:
根据文件类型,针对不同类型的文件,提取文件的特征信息,其中文本文件提取关键词或词向量表示,图像文件则提取颜色直方图以及图像特征向量,音频文件则提取音频指纹;
然后对文件特征相互间的比对和相似度及其相似度匹配,计算得到文件之间相似度值S,在一级筛选标准下,结合步骤S2中的文件和数据信息进行整理期间系统采纳数据给出的预设筛选标准中的相似度标准值S
6.根据权利要求4所述的一种数字信息批量处理方法,其特征在于:对于历史操作遗留的无用文件的判断方法为:根据文件下载时间进行判断,根据步骤S2的数据整理,将历史文件中下载时间较早的文件判断为无用文件,其中的单次删除的数据大小需满足占可删除总数据量的20%以上,同时不得高于30%,删除过程中,以优先落入该区间的删除量为标准,避免文件删除过多,用户想要调取时已被删除情况,也避免删除过少对数据信息批量处理产生的效果不大。
7.根据权利要求6所述的一种数字信息批量处理方法,其特征在于:无用文件的下载时间判断存在抵触标准,当符合抵触标准时,则直接标记为有用文件,抵触标准包括:运行系统类型文件和重要数据,而重要数据的判断方法为:对应文件的平均单次调用时长t、累计调用次数c,并以Z=α·t+β·c计算出重要数值Z,α、β分别为平均单次调用时长t和累计调用次数c的控制参数;同样的,计算出重要数值Z后,结合步骤S2中的文件和数据信息进行整理期间系统采纳数据给出的预设筛选标准中重要性标准值Z
8.根据权利要求7所述的一种数字信息批量处理方法,其特征在于:所述步骤S4中,二级标准判断的方法为:获取文件大小,设置统一文件大小的二级判断阈值u,阈值u根据当前手机总内存进行比例调整,当文件大小大于阈值u时,再识别文件类型信息,当文件类型为非视频类型时,获取扫描文件的最后打开或最后修改时间,当最后打开或最后修改时间大于30天时,则发送询问通知给用户,由用户反馈该文件的二级标准符合性,当文件类型为视频类型时,则进一步解析视频内容,对视频内容进行抽帧和对比,若对比相似度大于90%的抽帧画面高于30%,则对视频文件进行相似度时间段压缩处理,节约视频占用内存,反之则判断到达二级标准。