知嘟嘟-专利交易平台_专利购买_专利出售-买专利,上嘟嘟

欢迎来到知嘟嘟！联系电话：13336804447 卖家免费入驻，海量在线求购！卖家免费入驻，海量在线求购！

嘟嘟会员

帮助中心网站地图

查出售查高校查求购查年费

我要发布

首页转移热力图Hot 专利交易委托购买高校专区科技服务专利求购年费查询行业资讯

联系电话：13336804447

知嘟嘟经纪人

基于大数据的计算机数据挖掘方法

￥15800

专利号： 202310113188X

申请人：莱芜职业技术学院

专利类型：发明专利

专利状态：已下证

专利领域：计算；推算；计数

更新日期：2024-11-05

缴费截止日期：暂无

价格&联系人

年费信息

委托购买

专利简介

专利详情

委托购买说明

需准备材料

常见问题

摘要:

权利要求书:

1.一种基于大数据的计算机数据挖掘方法，其特征在于，包括以下步骤：获取描述产品的文本信息；根据文本信息提取产品的多个属性；

通过计算机获取描述该产品的待挖掘文本信息，形成待挖掘大数据；

根据待挖掘大数据中每个属性出现的次数，及与其余属性之间的距离获取每个属性的综合影响程度；

根据待挖掘大数据中任一属性的综合影响程度，及出现该属性的置信度，获取待挖掘大数据中任一属性的依赖度，依次获取每个属性的依赖度；

对每个属性的依赖度进行归一化获取归一化后的依赖度；

根据待挖掘大数据和每个属性与其对应归一化后的依赖度，获取每个属性的加权信息熵增益值；

根据每个属性的加权信息熵增益值构建产品属性的决策树，根据决策树对待挖掘大数据进行提纯；

所述每个属性的综合影响程度是按照以下步骤获取：

根据待挖掘大数据中第个属性出现的次数，及第个属性第次出现时距离首次出现的第个属性的距离获取第个属性的正影响程度；

根据待挖掘大数据中第个属性出现的次数，和第个属性第次出现时距离首次出现的第个属性的距离，及第个属性出现的次数，获取第个属性的负影响程度；

根据第个属性的正影响程度和负影响程度获取待挖掘大数据中第个属性的综合影响程度；

所述每个属性的依赖度是按照以下步骤获取：

根据待挖掘大数据中第个属性的综合影响程度，及在待挖掘大数据中出现第个属性时出现第个属性的置信度获取待挖掘大数据中第个属性的依赖度；

所述第个属性的依赖度计算公式如下：

式中，表示第个属性的依赖度；表示待挖掘大数据中出现第个属性时出现第个属性的置信度；表示属性的总数量；表示第个属性的综合影响程度；

所述每个属性的加权信息熵增益值计算公式如下：

式中，表示第个属性的加权信息熵增益值；表示待挖掘大数据的信息熵；表示利用第个属性划分待挖掘大数据后的信息熵；表示第个属性归一化后的依赖度；表示属性的总数量。

2.根据权利要求1所述的一种基于大数据的计算机数据挖掘方法，其特征在于，所述第个属性的正影响程度的计算公式如下：式中，表示第个属性的正影响程度；表示第个属性对于第个属性的正影响程度；表示属性的总数量；

其中，第个属性对于第个属性的正影响程度计算公式如下：式中，表示第个属性第次出现时距离首次出现的第个属性的距离；为第个属性总体出现次数；表示第个属性出现的次数。

3.根据权利要求1所述的一种基于大数据的计算机数据挖掘方法，其特征在于，所述第个属性的负影响程度的计算公式如下：式中，表示第个属性的负影响程度；表示第个属性对于第个属性的负影响程度；表示属性的总数量；

其中，第个属性对于第个属性的负影响程度的计算公式如下：式中，表示第个属性第次出现时距离首次出现的第个属性的距离；为第个属性第次出现时距离首次出现的第个属性的距离；

为第个属性总体出现次数；表示第个属性出现的次数；为第个属性出现的次数；表示非第个属性和非第个属性的其余属性的总数。

4.根据权利要求1所述的一种基于大数据的计算机数据挖掘方法，其特征在于，所述形成待挖掘大数据的过程中还按照以下步骤进行筛选：根据待挖掘大数据中的待挖掘文本信息和产品的文本信息获取每个待挖掘文本信息与文本信息的亲近度；将与文本信息的亲近度小于等于零的待挖掘文本信息进行清洗获取清洗后的待挖掘大数据；

根据产品的多个属性对清洗后的待挖掘大数据中的待挖掘文本信息进行筛选，获取与多个属性相同的待挖掘文本信息，形成筛选后的待挖掘大数据。

5.根据权利要求1所述的一种基于大数据的计算机数据挖掘方法，其特征在于，所述与其余属性之间的距离是文本中字符间的距离。

推荐专利

应用于云数字业务的大数据推荐方法及大数据挖掘系统

我要求购

我不想找了，帮我找吧

您有专利需要变现?

我要出售

智能匹配需求，快速出售

摘要:

权利要求书:

知嘟嘟

友情链接

关于我们

联系我们