欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 202110299571X
申请人: 湖南人文科技学院
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-01-05
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于社交网络的数据采集与分析系统,其特征在于,至少包括处理器(10),处理器(10)配置为:

获取社交网络的至少包括中心节点、边缘节点和/或间接节点的拓扑结构;

随机选取至少两个中心节点为数据采集的起始,并基于每个中心节点建立包括间接节点和/或边缘节点的第一存储空间;

基于第一存储空间寻找连接至少两个中心节点的间接节点/边缘节点,并以朝向该间接节点/边缘节点为方向进行数据采集。

2.根据权利要求1所述的数据采集与分析系统,其特征在于,处理器(10)配置为:基于中心节点获取包含间接节点和/或边缘节点的多个页面链接URL;

对页面链接URL解析将间接节点和/或边缘节点分为关于用户名的第一类节点、关于问答的第二类节点和关于文章的第三类节点。

3.根据权利要求1或2任一所述的数据采集与分析系统,其特征在于,在第一存储空间没有相同间接节点和/或边缘节点的情况下,处理器(10)配置为:基于选取的第一存储空间内的节点进行解析分别获取关于该节点的所包含的第一类节点、第二类节点和第三类节点;

将该节点所包含的第一类节点、第二类节点和第三类节点存储于第二存储空间;

基于第二存储空间寻找连接至少两个中心节点的间接节点/边缘节点,并以朝向该间接节点/边缘节点为方向进行数据采集。

4.根据前述权利要求任一所述的数据采集与分析系统,其特征在于,在第一存储空间内间接节点和/或边缘节点的个数小于第一阈值的情况下,处理器(10)配置为基于等概率的方式随机选取第一存储空间内的所有节点。

5.根据前述权利要求任一所述的数据采集与分析系统,其特征在于,在第一存储空间内间接节点和/或边缘节点的个数超过第一阈值的情况下,处理器(10)配置为优先选取第二类节点/第三类节点,其中,

处理器(10)配置为基于第二类节点和第三类节点包含的节点的数量调整选取第二类节点和第三类节点的概率。

6.根据前述权利要求任一所述的数据采集与分析系统,其特征在于,处理器(10)配置为按照如下方式采集选取的第一类节点/第二类节点/第三类节点:随机选取至少一个节点进行采集并解析其包含的节点,从而寻找相同的间接节点和/或边缘节点;

每隔第一时间选取新的节点,并优先基于该新的节点寻找相同的间接节点和/或边缘节点。

7.根据前述权利要求任一所述的数据采集与分析系统,其特征在于,处理器(10)配置为每间隔第一时间对已选取的节点的优先权进行评估。

8.根据前述权利要求任一所述的数据采集与分析系统,其特征在于,处理器(10)配置为:

将处理时间超过第二时间的已选取的节点的处理优先级调至最低,并基于间隔的第一时间的次数的累积增加其优先级。

9.根据前述权利要求任一所述的数据采集与分析系统,其特征在于,处理器(10)配置为在确定多个中间节点之间的隐含关系的情况下,随机选取未被采集的节点以时间公平的采集策略进行数据采集。

10.根据前述权利要求任一所述的数据采集与分析系统,其特征在于,处理器(10)配置为按照如下步骤基于社交网络采集的数据进行分析:计算特征文本中特征项的权重;

采用分类算法对用户的偏好建模得到每个用户及话题的特征向量;

基于文本的余弦相似度计算用户的偏好。