欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2022107285389
申请人: 武汉楷瀚文化传媒有限公司
专利类型:发明专利
专利状态:授权未缴费
专利领域: 计算;推算;计数
更新日期:2023-08-15
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于大数据分析的网页搜索历史记录智能管理系统,其特征在于,包括:

历史搜索记录预处理模块,用于对网页的历史搜索记录进行筛选,并从中剔除无效链接对应的历史搜索记录,得到各有效历史搜索记录,同时记为有效记录;

有效记录分类模块,用于对各有效记录进行分类,得到各搜索主体对应的各有效记录;

有效记录网页布局分析模块,用于对各搜索主体对应的各有效记录进行网页布局分析,得到各搜索主体中各有效记录对应的网页整体布局规范系数,其中有效记录网页布局分析模块包括有效记录网页段落布局分析单元、有效记录网页字体布局分析单元、有效记录网页颜色布局分析单元和有效记录网页整体布局分析单元;

有效记录网页展示效果分析模块,用于对各搜索主体对应的各有效记录进行网页展示效果分析,得到各搜索主体中各有效记录对应的展示效果评估系数;

有效记录网页内容关注分析模块,用于对各搜索主体对应的各有效记录进行网页内容关注分析,得到各搜索主体中各有效记录对应的内容关注系数;

有效记录网页综合价值分析模块,用于将各搜索主体中各有效记录对应的网页整体布局规范系数、展示效果评估系数和内容关注系数进行综合分析,得到各搜索主体中各有效记录对应的综合价值系数;

有效记录排序分析模块,用于对各搜索主体和各搜索主体对应的各有效记录进行排序分析,得到整体有效记录对应的排序;

有效记录排序显示模块,用于按照整体有效记录的排序进行依次显示;

信息存储库,用于存储各搜索主体对应的各关联词语,存储参考段落间距和参考行间距,存储单位段落对应的参考图片数量,存储各种浏览行为对应的权值因子,存储参考浏览时长,并存储参考阅读次数;

所述对各有效记录进行分类,其具体过程如下:

从各有效记录中提取各有效记录的搜索主体,并将各有效记录的搜索主体进行归类,得到各搜索主体对应的各有效记录;

按照预设顺序将各搜索主体编号为1,2,...,i,...,n,并按照预设顺序依次将各有效记录编号为1,2,...,j,...,m;

所述有效记录网页段落布局分析单元用于对各搜索主体中各有效记录对应的段落布局规范指数进行分析,其具体分析步骤如下:统计各搜索主体中各有效记录内存在的段落数量和各段落对应的行数,并获取各搜索主体中各有效记录内各段落之间的距离和各段落中各行之间的距离,同时从中筛选出最大段落间距、最小段落间距、最大行间距和最小行间距;

依据公式 计算出各搜索主体中各有效记录对应的段落布局

规范指数, 表示为第i个搜索主体中第j个有效记录对应的段落布局规范指数,i=1,

2.......n,j=1,2......m, 分别表示为第i个搜索主体中第j个有效记录对应的段落间距规范指数、行间距规范指数,β1、β2分别表示为预设段落间距规范指数、行间距规范指数对应的影响因子;

上述公式中, 分别表示为第i个

搜索主体中第j个有效记录对应的最大段落间距、最小段落间距, 表示为第i个搜索主体中第j个有效记录对应的平均段落间距, 表示为第i个搜索主体中第j个有效记录内第r个段落对应的段落间距,r表示为段落的编号,r=1,2,......s,l′表示为参考段落间距,β3、β

4分别表示为预设段落间距均匀度、段落间距差对应的影响因子;

个搜索主体中第j个有效记录对应的最大行间距、最小行间距, 表示为第i个搜索主体中第j个有效记录对应的平均行间距, 表示为第i个搜索主体中第j个有效记录内第r个段落对应第g行的行间距,g表示为行的编号,g=1,2,......f,h′表示为参考行间距,β5、β6分别表示为预设行间距均匀度、行间距差对应的影响因子。

2.根据权利要求1所述的一种基于大数据分析的网页搜索历史记录智能管理系统,其特征在于:所述有效记录网页字体布局分析单元用于对各搜索主体中各有效记录对应的整体文字规范指数进行分析,其具体分析步骤如下:统计各搜索主体中各有效记录内存在的标题数量和标题级别,从而获取各搜索主体中各有效记录内各标题级别的字号大小,并将相同标题级别的字号大小进行相互比对,统计各标题级别中字号大小不一致的标题数量;

统计各搜索主体中各有效记录内正文内容存在的文字数量,记为 并获取正文内容中各文字对应的字号大小,同时将正文内容中各文字对应的字号大小进行相互比对,统计正文内容中字号大小不一致的文字数量;

对各搜索主体中各有效记录对应各标题级别下字号大小不一致的标题数量和正文内容下字号大小不一致的文字数量进行综合分析,得到各搜索主体中各有效记录对应的整体文字规范指数,并将其标记为

3.根据权利要求2所述的一种基于大数据分析的网页搜索历史记录智能管理系统,其特征在于:所述有效记录网页颜色布局分析单元用于对各搜索主体中各有效记录对应的颜色布局规范指数进行分析,其具体分析过程如下:从各搜索主体中各有效记录内剔除各级标题和重点标记,进而获取各搜索主体中各有效记录内各文字对应的色度值,并从中筛选出最大色度值和最小色度值,同时统计各搜索主体中各有效记录对应的文字颜色种类数量;

对各搜索主体中各有效记录对应的最大色度值、最小色度值和文字颜色种类数量进行综合分析,得到各搜索主体中各有效记录对应的颜色布局规范指数,并记为

4.根据权利要求3所述的一种基于大数据分析的网页搜索历史记录智能管理系统,其特征在于:所述有效记录网页整体布局分析单元用于计算各搜索主体中各有效记录对应的网页整体布局规范系数,其具体计算公式为 表示为第i个搜索主体中第j个有效记录对应的网页整体布局规范系数,a1、a2、a3分别表示为预设段落布局规范指数、整体文字规范指数、颜色布局规范指数对应的系数因子。

5.根据权利要求4所述的一种基于大数据分析的网页搜索历史记录智能管理系统,其特征在于:所述对各搜索主体对应的各有效记录进行网页展示效果分析,其具体分析步骤如下:统计各搜索主体中各有效记录内存在的文字总数量,将各搜索主体中各有效记录内的各文字与信息存储库中存储的各搜索主体对应的各关联词语进行匹配,得到各搜索主体中各有效记录对应的匹配关联词语数量;

统计各搜索主体中各有效记录存在的图片总数量和各段落存在的图片数量;

对各搜索主体中各有效记录对应的文字总数量、匹配关联词语数量、图片总数量和各段落图片数量进行综合分析,得到各搜索主体中各有效记录对应的展示效果评估系数

6.根据权利要求5所述的一种基于大数据分析的网页搜索历史记录智能管理系统,其特征在于:所述对各搜索主体对应的各有效记录进行网页内容关注分析,其具体分析步骤如下:统计各搜索主体中各有效记录对应的阅读总次数,并将各次阅读按照预设顺序依次编号为1,2,...,y,...,z,同时获取各搜索主体中各有效记录对应各次阅读的阅读时长;

统计各次阅读中存在的浏览行为数量,并将各次浏览行为按照预设顺序依次编号为1,

2,...,d,...,k;

将各搜索主体中各有效记录内各次阅读对应的各次浏览行为与信息存储库中存储的各种浏览行为对应的权值因子进行匹配,得到各搜索主体中各有效记录内各次阅读对应各次浏览行为的权值因子;

对各搜索主体中各有效记录内阅对应阅读总次数、各次阅读的阅读时长和各次阅读对应各次浏览行为的权值因子进行综合分析,得到各搜索主体中各有效记录对应的内容关注系数,记为

7.根据权利要求6所述的一种基于大数据分析的网页搜索历史记录智能管理系统,其特征在于:所述各搜索主体中各有效记录对应的综合价值系数,其具体计算公式为表示为第i个搜索主体中第j个有效记录对应的综合价值系数,c1、c2、c3分别表示为预设网页整体布局规范系数、展示效果评估系数、内容关注系数对应的影响因子。

8.根据权利要求1所述的一种基于大数据分析的网页搜索历史记录智能管理系统,其特征在于:所述对各搜索主体和各搜索主体对应的各有效记录进行排序分析,其具体分析如下:将各搜索主体中各有效记录对应的综合价值系数按照从大到小的顺序依次进行排序,并作为各搜索主体对应各有效记录的排序;

将各搜索主体中各有效记录对应的综合价值系数进行累加,得到各搜索主体对应的整体综合价值系数,并将各搜索主体对应的整体综合价值系数按照从大到小的顺序依次进行排序,由此作为各搜索主体对应的排序;

将各搜索主体对应各有效记录的排序和各搜索主体对应的排序进行整合,将整合后的记录记为整体有效记录,进而对整体有效记录进行综合排序。