知嘟嘟-专利交易平台_专利购买_专利出售-买专利,上嘟嘟

欢迎来到知嘟嘟！联系电话：13336804447 卖家免费入驻，海量在线求购！卖家免费入驻，海量在线求购！

嘟嘟会员

帮助中心网站地图

查出售查高校查求购查年费

我要发布

首页转移热力图Hot 专利交易委托购买高校专区科技服务专利求购年费查询行业资讯

联系电话：13336804447

知嘟嘟经纪人

基于标签特定特征和相关性的文本数据多标签分类方法

￥21000

专利号： 2021113152981

申请人：重庆邮电大学

专利类型：发明专利

专利状态：授权未缴费

专利领域：计算；推算；计数

更新日期：2024-11-06

缴费截止日期：暂无

价格&联系人

年费信息

委托购买

专利简介

专利详情

委托购买说明

需准备材料

常见问题

摘要:

权利要求书:

1.一种基于标签特定特征和相关性的文本数据多标签分类方法，其特征在于，包括以下步骤：

101、对文本数据进行预处理,结合实例标签空间和特征空间构造新的实例特征空间；

102、对正负实例特征空间计算聚类个数，并构造标签特定特征；

103、对文本数据集中成对标签计算相关性，构造标签间相关性无向完全图；

104、采用扩展Kruskal算法在标签间相关性无向完全图中计算最大生成树集合；

105、从树集合中依次选择生成树，并从根节点开始使用二分类器在树上进行递归预测，对预测结果进行树上集成得出文本实例标签集；

所述步骤101文本数据预处理为：对正负实例数据集将特征空间与标签空间合并，使得多个剩余标签补充特征空间构造正负实例特征空间其中D＝{(x

所述步骤102对正负实例特征空间计算聚类个数，并构造标签特定特征，具体步骤为：

1021.为将正负实例特征转换为标签特定特征，首先根据特征空间计算标签特定特征空间大小，为防止特征空间过大造成标签特定特征维度爆炸，取正负空间大小中较小值，并使用对数对其进行缩放，最终得出聚类个数m

1022.采用K-MEANS算法对正负实例空间进行聚类，将原始特征空间向量与聚类中心点结合聚类点个数进行度量，从原始的d维空间其中

1031.定义相关性无向完全图：在图中任意两个标签顶点之间都存在相关性边且不存在自环和重边；

1032.对标签空间采用corr(l

其中|l

2.根据权利要求1所述的基于标签特定特征和相关性的文本数据多标签分类方法，其特征在于，所述步骤104采用扩展Kruskal算法在图中计算最大生成树，选取树中每个顶点为根生成多棵权值相同但树高度不同的最大生成树，并根据树的高度从低到高排序的具体步骤为：

1041.定义最大生成树：一个含有所有标签节点连通图的生成树，包含成对标签间相关性无向完全图中所有标签并且有保持相关性连通图最大权值和的边集；

1042.定义扩展Kruskal算法：采用贪心的思想，将边集合按照权值降序排序，然后对相同权值的边进行递归搜索生成不同树结构，直至生成总权值相同的最大生成树集合；

1043.对于最大生成树集合，枚举树中的任意子节点为根节点进行树重构，一棵最大生成树会产生|V|个不同的树结构，V表示树上节点集合，并对每棵重构树根据树高度从低到高排序。

3.根据权利要求2所述的基于标签特定特征和相关性的文本数据多标签分类方法，其特征在于，所述扩展Kruskal算法步骤：

1).将带有相关性的边集合按照权值降序排序；

2).对权值边进行递归搜索:如果这条边加入当前树中不会构成回路，则将该边加入到树中，直至所有标签节点都在树中；

3).对于2中得出的最大生成树，枚举每个点为根节点构建多棵最大生成树，根据高度从底到高排序。

4.根据权利要求2所述的基于标签特定特征和相关性的文本数据多标签分类方法，其特征在于，所述步骤105从树集合中依次选择生成树，并从根节点开始使用二分类器在树上进行递归预测，对预测结果进行树上集成得出文本实例标签集，具体步骤为：

1051.对于步骤105中多棵结构不同的相关性最大生成树，选择前m其中ancestor(l

1053.采用二分类器对该标签节点数据集

η(Y

1054.由于选择根节点的不同会造成不同的树结构，表达的标签间强相关性也不一样，为了充分利用标签间的强相关性，同时减小选择不同根节点带来的影响，使用多棵树进行多标签分类,对于一个未知实例

推荐专利

结合GPU-DMM与文本特征的短文本关键词提取方法

我要求购

我不想找了，帮我找吧

您有专利需要变现?

我要出售

智能匹配需求，快速出售

摘要:

权利要求书:

知嘟嘟

友情链接

关于我们

联系我们