欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2014101608692
申请人: 安一恒通(北京)科技有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-02-23
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种定位目标样本的方法,其特征在于,包括:将样本文件转换为字符串;

对所述字符串进行分词处理,得到分词处理后的样本文件;

如果所述分词处理后的样本文件中包括预设的关键词,将所述包括预设的关键词的样本文件确定为目标样本。

2.根据权利要求1所述的方法,其特征在于,所述将样本文件转换为字符串,包括:对所述样本文件进行脱壳处理;

将脱壳处理后的样本文件转换为字符串。

3.根据权利要求1所述的方法,其特征在于,所述对所述字符串进行分词处理,得到分词处理后的样本文件,包括:对所述字符串进行降噪处理,得到降噪处理后的字符串;

对所述降噪处理后的字符串进行分词处理,得到分词处理后的样本文件。

4.根据权利要求1至3任一项所述的方法,其特征在于,所述得到分词处理后的样本文件之后,所述方法还包括:建立每个分词与包括所述分词的样本文件之间的对应关系。

5.根据权利要求4所述的方法,其特征在于,所述如果所述分词处理后的样本文件中包括预设的关键词,将所述包括预设的关键词的样本文件确定为目标样本,包括:根据所述对应关系,将与所述预设的关键词相同的分词对应的样本文件,确定为目标样本。

6.一种定位目标样本的装置,其特征在于,包括:转换模块,用于将样本文件转换为字符串;

处理模块,用于对所述字符串进行分词处理,得到分词处理后的样本文件;

确定模块,用于如果所述分词处理后的样本文件中包括预设的关键词,将所述包括预设的关键词的样本文件确定为目标样本。

7.根据权利要求6所述的装置,其特征在于,所述转换模块包括:第一单元,用于对所述样本文件进行脱壳处理;

第二单元,用于将脱壳处理后的样本文件转换为字符串。

8.根据权利要求6所述的装置,其特征在于,所述处理模块包括:第三单元,用于对所述字符串进行降噪处理,得到降噪处理后的字符串;

第四单元,用于对所述降噪处理后的字符串进行分词处理,得到分词处理后的样本文件。

9.根据权利要求6至8任一项所述的装置,其特征在于,还包括:建立模块,用于建立每个分词与包括所述分词的样本文件之间的对应关系。

10.根据权利要求9所述的装置,其特征在于,所述确定模块具体用于:根据所述对应关系,将与所述预设的关键词相同的分词对应的样本文件,确定为目标样本。