知嘟嘟-专利交易平台_专利购买_专利出售-买专利,上嘟嘟

欢迎来到知嘟嘟！联系电话：13336804447 卖家免费入驻，海量在线求购！卖家免费入驻，海量在线求购！

嘟嘟会员

帮助中心网站地图

查出售查高校查求购查年费

我要发布

首页转移热力图Hot 专利交易委托购买高校专区科技服务专利求购年费查询行业资讯

联系电话：13336804447

知嘟嘟经纪人

面向文本的数字取证分析方法、装置和计算机可读介质

￥21500

专利号： 2018106856606

申请人：北京工业大学

专利类型：发明专利

专利状态：已下证

专利领域：计算；推算；计数

更新日期：2024-02-23

缴费截止日期：暂无

价格&联系人

年费信息

委托购买

专利简介

专利详情

委托购买说明

需准备材料

常见问题

摘要:

权利要求书:

1.一种数字取证方法，其特征在于，所述方法包括：

对待取证文本的文本内容进行预处理，得到多个主干词；其中，所述主干词为所述待取证文本中除标点符号和停用词以外的词，所述停用词包括以下至少之一：形容词，副词，代词；

基于训练好的文档主题生成LDA模型获取所述主干词中的特征词，得到多个特征词，并基于多个所述特征词确定特征词向量；

计算所述特征词向量和预设的敏感词向量之间的语义相似度，并基于所述语义相似度得到语义相似度最大值向量；

基于所述语义相似度最大值向量确定所述待取证文本是否为取证目标。

2.根据权利要求1所述的方法，其特征在于，计算所述特征词向量和预设的敏感词向量之间的语义相似度，并基于所述语义相似度得到语义相似度最大值向量包括：计算所述特征词向量中的第i个特征词与所述敏感词向量中第k个敏感词之间的语义相似度，得到多个语义相似度值，其中，i依次取1至m，m为所述特征词向量中的特征词数量，k依次取1至j，j为所述敏感词向量中的敏感词数量；

在所述多个语义相似度值中查找每个特征词与各个所述敏感词之间的最大语义相似度值，得到多个最大语义相似度值；

将所述多个最大语义相似度值确定为所述最大语义相似度值向量。

3.根据权利要求2所述的方法，其特征在于，计算所述特征词向量中的第i个特征词与所述敏感词向量中第k个敏感词之间的语义相似度包括：通过公式计算所

述第i个特征词与所述第k个敏感词之间的语义相似度；

其中，Simi,k为所述第i个特征词与所述第k个敏感词之间的语义相似度，λ为预设权重系数值，featurei表示第i个特征词，sk表示第k个敏感词，lsc为所述特征词和所述敏感词在预设语料库中的最小下义词的集合，depth(featurei)和depth(sk)分别为所述第i个特征词和所述第k个敏感词在所述预设语料库中的结构深度，depth(lcs)为所述最小下义词的集合在所述预设语料库中的结构深度；IC(featurei)和IC(sk)分别表示所述第i个特征词和所述第k个敏感词的信息熵，IC(lcs)表示所述最小下义词的集合的信息熵。

4.根据权利要求1所述的方法，其特征在于，对待取证文本的文本内容进行预处理，得到多个主干词包括：使用文本分析法将所述待取证文本中的标点符号和停用词过滤掉，得到多个所述主干词。

5.根据权利要求1所述的方法，其特征在于，基于所述语义相似度最大值向量确定所述待取证文本是否为取证目标包括：计算所述语义相似度最大值向量中的所有语义相似度最大值的和，得到目标值；

将所述目标值与预设阈值进行比较，得到比较结果；

如果所述比较结果为所述目标值大于或等于所述预设阈值，则确定所述待取证文本为所述取证目标。

6.一种数字取证装置，其特征在于，所述装置包括：

预处理模块，用于对待取证文本的文本内容进行预处理，得到多个主干词；其中，所述主干词为所述待取证文本中除标点符号和停用词以外的词，所述停用词包括以下至少之一：形容词，副词，代词；

获取模块，用于基于训练好的文档主题生成LDA模型获取所述主干词中的特征词，得到多个特征词，并基于多个所述特征词确定特征词向量；

计算模块，用于计算所述特征词向量和预设的敏感词向量之间的语义相似度，并基于所述语义相似度得到语义相似度最大值向量；

确定模块，用于基于所述语义相似度最大值向量确定所述待取证文本是否为取证目标。

7.根据权利要求6所述的装置，其特征在于，所述计算模块包括：计算单元，用于计算所述特征词向量中的第i个特征词与所述敏感词向量中第k个敏感词之间的语义相似度，得到多个语义相似度值，其中，i依次取1至m，m为所述特征词向量中的特征词数量，k依次取1至j，j为所述敏感词向量中的敏感词数量；

查找单元，用于在所述多个语义相似度值中查找每个特征词与各个所述敏感词之间的最大语义相似度值，得到多个最大语义相似度值；

确定单元，用于将所述多个最大语义相似度值确定为所述最大语义相似度值向量。