欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2016101647126
申请人: 华南师范大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-07-01
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种数据采集方法,其特征在于,包括以下步骤:获取采集条件,并根据所述采集条件获取目标数据,其中,所述采集条件包括采集对象和采集属性;

从知识库获取对应所述目标数据的样本数据;

根据所述目标数据和所述样本数据判断所述目标数据是否可信;

若是,则采集所述目标数据存入目标数据库或大数据存储库。

2.根据权利要求1所述的数据采集方法,其特征在于,所述从知识库获取对应所述目标数据的样本数据的步骤包括:从所述目标数据中选取待对比数据,并从所述知识库中获取所述采集条件与所述待对比数据相同的标准数据作为所述样本数据。

3.根据权利要求2所述的数据采集方法,其特征在于,所述根据所述目标数据和所述样本数据判断所述目标数据是否可信的步骤包括:分别提取所述待对比数据与所述样本数据的预设特征;

判断所述待对比数据的预设特征与所述样本数据的预设特征之间的匹配度是否大于或等于预设值;

若是,则判定所述目标数据可信。

4.根据权利要求1所述的数据采集方法,其特征在于,所述从知识库获取对应所述目标数据的样本数据的步骤包括:从所述知识库中获取与所述目标数据的所述采集条件中采集对象不同、采集属性相同的标准数据作为所述样本数据。

5.根据权利要求4所述的数据采集方法,其特征在于,所述根据所述目标数据和所述样本数据判断所述目标数据是否可信的步骤包括:获取提供所述目标数据的被采集对象,并获取所述被采集对象提供的采集对象和采集属性均与所述样本数据相同的数据作为样本采集数据;

分别提取所述样本采集数据和所述样本数据的预设特征;

判断所述样本采集数据的预设特征与所述样本数据的预设特征之间的匹配度是否大于或等于预设值;

若是,则判定所述目标数据可信。

6.一种数据采集系统,其特征在于,包括:

目标数据获取模块,用于获取采集条件,并根据所述采集条件获取目标数据,其中,所述采集条件包括采集对象和采集属性;

样本数据获取模块,用于从知识库获取对应所述目标数据的样本数据;

数据分析模块,用于根据所述目标数据和所述样本数据判断所述目标数据是否可信;

数据采集模块,用于在所述目标数据可信时,采集所述目标数据存入目标数据库或大数据存储库。

7.根据权利要求6所述的数据采集系统,其特征在于,所述样本数据获取模块具体用于:从所述目标数据中选取待对比数据,并从所述知识库中获取所述采集条件与所述待对比数据相同的标准数据作为所述样本数据。

8.根据权利要求7所述的数据采集系统,其特征在于,所述数据分析模块具体用于:分别提取所述待对比数据与所述样本数据的预设特征,判断所述待对比数据的预设特征与所述样本数据的预设特征之间的匹配度是否大于或等于预设值,并在所述匹配度大于或等于预设值时,判定所述目标数据可信。

9.根据权利要求6所述的数据采集系统,其特征在于,所述样本数据获取模块具体用于:从所述知识库中获取与所述目标数据的所述采集条件中采集对象不同、采集属性相同的标准数据作为所述样本数据。

10.根据权利要求9所述的数据采集系统,其特征在于,所述数据分析模块包括:样本采集数据获取单元,用于获取提供所述目标数据的被采集对象,并获取所述被采集对象提供的采集对象和采集属性均与所述样本数据相同的数据作为样本采集数据;

特征提取单元,用于分别提取所述样本采集数据和所述样本数据的预设特征;

匹配度分析单元,用于判断所述样本采集数据的预设特征与所述样本数据的预设特征之间的匹配度是否大于或等于预设值,并在所述匹配度大于或等于预设值时,判定所述目标数据可信。