1.一种人脸识别测试系统的数据集存储方法,其特征在于,所述方法包括以下步骤步骤1.定制数据集:爬取多个人脸公开数据集,根据人脸识别SDK应用的三个场景,将数据集分为十四个属性;
步骤2.数据集指标统一化:设计一种64位的图片命名的编号结构,根据每种属性所占位数设计统一的文件的命名格式,自行编写脚本代码,将各个数据集文件名转换为设定的统一的格式;
步骤3.文件名作为元数据维护到redis‑cluster:将数据集按照不同个人存储分区,所有数据集信息维护在redis‑cluster集群中,在redis‑cluster中使用Hash结构将网上采集到的数据集按人名分配好,并将数据集存储路径和图片文件名元数据信息存储在Set集合中;
步骤4.采用Redis Hash数据结构存储键值数据:采用两hash结构建立索引,取文件的
64位ID值,将高32位作为全局hash表的键值,低32位作为hash数据结构的键值,再将真实的文件ID存入键值中,建立索引后,存储服务就可以利用索引将图片文件交给SDK测试服务。
2.如权利要求1所述的一种人脸识别测试系统的数据集存储方法,其特征在于,所述步骤2中,数据集指标统一化,统一化具体步骤如下:
2.1确定文件名的存储结构的涵盖属性;
2.2根据每个属性所包含的类型,进行位数分配,得到统一化的文件名存储数据结构;
2.3根据不同的数据集编写不同的python脚本文件进行查询,得到原始的数据标签;
2.4根据统一化的数据结构,编写脚本,将各个数据集文件名统一化;
2.5保存统一化后的图片数据。
3.如权利要求1或2所述的一种人脸识别测试系统的数据集存储方法,其特征在于,所述步骤4中,Redis Hash数据结构存储键值数据的具体过程如下:
4.1取统一化后文件的ID值,ID值为64位;
4.2将ID值切分为两部分,即高32位和低32位;
4.3高32位作为全局哈希表的键值;
4.4低32位作为Hash数据结构的键值;
4.5将真实文件ID存入键值中;
4.6建立索引后,存储服务利用索引取得图片文件交给SDK测试服务。
4.如权利要求1或2所述的一种人脸识别测试系统的数据集存储方法,其特征在于,所述步骤1中,人脸公开数据集为CAS‑PEAL、WIDER FACE、Labeled Faces in the Wild、YouTube Faces DB、CASIA‑SURF,三个场景为人脸1:1识别功能、人脸1:N识别功能、人脸识别特殊功能,十四个属性为活体检测、种族、时间跨度、3D角度检测、光照角度、多饰物、背景变化、小人脸检测、多人脸检测、年龄识别、模糊检测、遮挡检测、性别识别和视频验证。