1.一种基于大数据的智能数据信息统计管理方法,其特征在于,所述方法包括:
步骤S100:对用户在智能设备产生的每一个历史浏览记录进行分析,筛选出有效历史浏览记录,对所述有效历史浏览记录进行数据提取,获取所述有效历史浏览记录对应的历史行为数据,根据所述历史行为数据对疑似偏爱值进行计算,将疑似偏爱值大于疑似偏爱值阈值的历史行为数据进行保留,提取所述历史行为数据对应的信息内容,将所述信息内容记为用户疑似偏爱信息内容;
所述步骤S100包括:
步骤S101:当所述历史浏览记录中存在用户浏览时间大于浏览时间阈值时,将历史浏览记录进行保留,将保留的历史浏览记录记为有效历史浏览记录,对有效历史浏览记录进行用户行为提取,获取有效历史浏览记录对应的历史行为数据,所述历史行为数据包括用户对信息内容的浏览时间、滑动次数;对历史行为数据对应的信息内容进行用户疑似偏爱评估;
步骤S102:所述用户疑似偏爱评估包括,对所述历史行为数据进行归一化处理,对原始的历史行为数据进行线性变换,将数据映射到[0,1]之间,根据所述历史行为数据进行归一化处理的映射结果,计算用户的疑似偏爱值V:V=(d+b)×δ:
其中,d为用户对信息内容浏览时间进行归一化处理后的映射值,b为用户对信息内容滑动次数进行归一化处理后的映射值;δ为疑似偏爱值对应的偏爱影响系数;
步骤S103:当疑似偏爱值大于疑似偏爱值阈值,对历史行为数据进行保留,提取用户的历史行为数据对应的信息内容,将所述信息内容记为用户疑似偏爱信息内容;
步骤S200:对用户疑似偏爱信息内容的所属信息类型进行判定,获得所述用户疑似偏爱信息内容对应的信息类型,对信息类型相同的各个用户疑似偏爱信息内容对应的有效历史浏览记录进行提取,得到所述信息类型的用户偏向数据;根据用户偏向数据计算用户偏爱值,将用户偏爱值大于用户偏爱值阈值的信息类型进行保留,记为用户偏爱信息类型;
所述步骤S200包括:
步骤S201:对用户疑似偏爱信息内容进行所属信息类型判定,其中,判定的过程为对用户疑似偏爱信息内容进行关键字提取汇集,得到用户疑似偏爱信息内容对应的关键字集合,当从两部分用户疑似偏爱信息内容中提取得到的关键字集合之间相似度大于相似度阈值时,判定所述两部分用户疑似偏爱信息内容属于相同信息类型;对信息类型相同的各个用户疑似偏爱信息内容对应的有效历史浏览记录进行提取,得到对应信息类型的用户偏向数据;所述用户偏向数据包括信息类型数据包括有效历史浏览记录的总次数、有效历史浏览记录的平均值疑似偏爱值;
步骤S202:计算信息类型对应的用户偏爱值P:
P=h×e×μ;
其中,h为有效历史浏览记录的总次数;e为有效历史浏览记录的平均值疑似偏爱值;μ为信息类型对应的用户偏爱值影响系数;
步骤S203:对信息类型对应的用户偏爱值进行汇集,得到集合U,将集合U中的用户偏爱值大于用户偏爱值阈值对应的信息类型进行保留,将所述信息类型记为用户偏爱信息类型;
步骤S300:对用户偏爱信息类型中各个信息内容中用户评论区行为进行分析,获取用户对应的用户评论行为数据;当用户评论次数大于评论次数阈值时,提取用户偏爱信息类型中各个信息内容评论区的评论显示内容;对所述评论区显示内容提取表情包数据、评论语气数据,将出现频率次数大于次数阈值的表情包数据或者评论语气数据作为对应所述用户偏爱信息类型的特征评论数据;
步骤S400:基于用户偏爱信息类型和特征评论数据,向用户推荐用户偏爱信息类型对应的信息内容,并将含有特征评论数据对应评论内容显示次序进行提高。
2.根据权利要求1所述的一种基于大数据的智能数据信息统计管理方法,其特征在于,所述步骤S300包括:步骤S301:对所述用户偏爱信息类型中各个信息内容的用户评论行为进行分析,获取用户对应的用户评论行为数据;用户行为数据包括用户在各个信息内容评论区下的评论次数;当用户偏爱信息类型对应的信息内容评论区中的评论次数大于评论次数阈值时,对信息内容评论区显示内容进行保留;
步骤S302:对保留的各个评论显示内容提取表情包数据、评论语气数据;将出现频率次数大于次数阈值的表情包数据或者评论语气数据作为对应所述用户偏爱信息类型的特征评论数据。
3.根据权利要求2所述的一种基于大数据的智能数据信息统计管理方法,其特征在于,所述步骤S400包括:步骤S401:根据所述用户偏爱信息类型,对所述智能设备推荐的内容信息进行数据优化,增加所述用户偏爱信息类型对应的内容信息的推荐频率;
步骤S402:基于特征评论数据,对信息内容中的评论显示次序进行处理,当评论内容符合特征评论数据,将评论内容显示次序进行提高;当评论内容不符合特征评论数据,对评论内容展现次序不做处理。
4.一种智能数据信息统计管理系统,其应用权利要求1‑3中任意一项所述的一种基于大数据的智能数据信息统计管理方法,其特征在于,所述系统包括疑似偏爱信息内容模块、偏爱信息类型模块、偏爱评论获取模块、内容展示模块;
所述疑似偏爱信息内容模块,用于对用户在智能设备产生的每一个历史浏览记录进行分析,筛选出有效历史浏览记录,对所述有效历史浏览记录进行数据提取,获取所述有效历史浏览记录对应的历史行为数据,提取所述历史行为数据对应的信息内容,将所述信息内容记为所述用户疑似偏爱信息内容;
所述偏爱信息类型模块,用于对所述用户疑似偏爱信息内容的所属信息类型进行判定,获得所述用户疑似偏爱信息内容对应的信息类型,对所述信息类型对应的信息类型数据进行提取,根据所述信息类型数据计算用户偏爱值,将所述用户偏爱值大于用户偏爱值阈值的信息类型进行保留,将所述信息类型记为用户偏爱信息类型;
所述偏爱评论获取模块,用于对用户在所述信息类型中评论区行为进行数据提取,建立用户评论行为模型,对用户行为数据进行分析,获取所述信息类型评论区的评论吸引数据,对所述评论区显示内容进行特征提取,得到所述评论显示内容对应的特征评论数据;
所述内容展示模块,用于对基于所述用户偏爱信息类型和所述特征评论数据,向所述用户推荐所述信息类型对应的信息内容,并将含有所述特征评论数据对应评论内容显示次序进行提高。
5.根据权利要求4所述的智能数据信息统计管理系统,其特征在于,所述疑似偏爱信息内容模块包括疑似偏爱值单元、疑似偏爱信息内容单元;
所述疑似偏爱值单元,用于根据历史行为数据对所述历史行为数据对应的信息内容进行用户疑似偏爱评估,得到用户的疑似偏爱值;
所述疑似偏爱信息内容单元,用于对当所述疑似偏爱值大于疑似偏爱值阈值,对所述历史行为数据进行保留,提取所述用户的历史行为数据对应的信息内容,将所述信息内容记为用户疑似偏爱信息内容。
6.根据权利要求4所述的智能数据信息统计管理系统,其特征在于,所述偏爱信息类型模快包括用户偏爱值单元、偏爱信息类型单元;
所述用户偏爱值单元,用于对按照所述信息内容涉及的不同信息类型,对所述信息内容进行分类,对信息类型相同的各个用户疑似偏爱信息内容对应的有效历史浏览记录进行提取,得到对应信息类型的用户偏向数据,对用户偏爱值进行计算;
所述偏爱信息类型单元,用于对所述信息类型对应的用户偏爱值进行汇集,对汇集的数据进行筛选,得到用户偏爱的信息类型。
7.根据权利要求4所述的智能数据信息统计管理系统,其特征在于,所述偏爱评论获取模块包括用户行为单元、偏爱特征评论数据单元;
所述用户行为单元,用于对所述用户偏爱信息类型中的各个信息内容的用户评论区行为进行分析;
所述偏爱特征评论数据单元,用于对各个评论显示内容进行关键内容提取,得到所述信息类型对应的评论内容数据;对所述评论内容数据进行特征提取,得到所述评论显示内容对应的特征评论数据。
8.根据权利要求4所述的智能数据信息统计管理系统,其特征在于,所述内容展示模块包括内容信息展示单元、评论内容展示单元;
所述内容信息展示单元,用于对根据所述用户偏爱信息类型,对所述智能设备推荐的内容信息进行数据优化,增加所述用户偏爱信息类型对应的内容信息的推荐频率;
所述评论内容展示单元,用于对基于所述特征评论数据,对信息内容中的评论显示次序进行处理,当所述评论内容符合特征评论数据,将所述评论内容显示次序进行提高;当所述评论内容不符合所述特征评论数据,对所述评论内容展现次序不做处理。