欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2023103297023
申请人: 易宝支付有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-12-25
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于互联网的计算机数据整合管理方法,其特征在于:所述计算机数据整合管理方法包括具体以下步骤:

S100、通过计算机设备中对数据源前端的历史用户行为数据进行采集,根据所述用户行为数据分析出不同身份识别号的所属用户,获取用户在相同的数据源中所属的不同身份识别号;

S200、根据用户所属不同身份识别号相对应数据源日志的相关数据,对用户所属不同身份识别号在相同数据源中的用户行为进行分析,判断用户所属不同身份识别号的重要程度;

S300、根据用户所属不同身份识别号的重要程度对需要进行整合的用户所属不同身份识别号对应的数据进行筛选;

S400、根据数据源的筛选结果对需要整合数据源中的数据整合情况进行分析,判断分析出用户需要进行数据抽取和重组对应的身份识别号;

所述S100中获取同一个用户所属的不同身份识别号的具体方法如下:

S101、通过对计算机设备中任意一个数据源前端埋点采集在计算机设备数据源前端发生的用户行为,对用户行为进行统计并且发送到后台数据服务器中;通过后台数据服务器获取到用户在计算机设备的数据源中进行登录时输入的账号密码以及用户在计算机设备中数据源登录页面的操作行为;

S102、通过后台数据服务器获取到的数据信息中任选两次登录时的身份识别号在计算机设备中数据源登录页面的操作行为Wi和Wv,将任选两次登录时的身份识别号在计算机设备中数据源登录页面的操作行为映射到n维空间中分别得到(X计算得到两次登录时的身份识别号在计算机设备中数据登录页面的操作行为的关联性D,当D小于设定的阈值时,标记所述任选两次登录时的身份识别号为同一个用户,对标记为同一个用户任选两次登录时的身份识别号进行进一步的分析;

S103、将标记为同一个用户任选两次登录时身份识别号的账号和密码映射到n维空间中,利用余弦相似度公式计算得到标记为同一个用户任选两次登录时身份识别号的相似度为d;当d∈[C,1)时,任选两次登录时身份识别号为同一个用户所属不相同的身份识别号;当d=1时,任选两次登录时身份识别号为同一个用户所属相同的身份识别号,其中C为大于0小于1的常数;

所述S200中对用户所属不同身份识别号的重要程度进行判断的具体方法如下:

S201、在对后台数据服务器中的用户在计算机设备中数据源登录时留下的身份识别号进行遍历整合得到在该计算机设备数据源中所有相同用户所属的不同身份识别号,通过数据源日志获取到任意一个用户所属的不同身份识别的相关数据信息进行分析;

S202、所述任意一个用户所属的不同身份识别的相关数据信息包括用户所属不同身份识别号在计算机设备中数据源的登录次数Ta、用户所属不同身份识别号在登录时产生的数据信息量为ma,根据公式Ma=Ta*ma,能够得到用户所属不同身份识别号在数据源登录时所产生的所有数据信息量,其中a=1,2,3,……,A,A为常数;

S203、根据公式Pa=k1*Ma+k2*Ta,计算得到任意一个用户所属的不同身份识别号的重要程度,其中k1和k2分别为用户所属不同身份识别号在登录时产生的所有数据信息量和用户所属不同身份识别号在计算机设备中数据源的登录次数与用户所属不同身份识别号重要程度之间的系数;

所述S300中对需要进行整合的用户所属不同身份识别号对应数据进行筛选的具体方法如下:

S301、从计算机设备数据源日志中获取到用户所属不同身份识别号产生的数据信息,对用户所属不同身份识别号中任意一个身份识别号产生的数据信息进行分析得到计算机设备数据源中身份识别号产生数据信息中的传输链路个数,对用户所属不同身份识别号进行遍历得到用户所属不同身份识别号产生数据信息中的传输链路个数Ra;

S302、通过公式Ua=Pa*Ra,对Ua从高到低依次进行排序后,对序列进行划分将身份识别号分为重要身份识别号、次要身份识别号以及无关身份识别号;对无关身份识别号的数据信息从需要整合的用户所属不同身份识别号中进行剔除后,用户所属的不同身份识别号为Lb,b=1,2,3,……,B,B为常数且B小于A;

所述S400中对用户需要进行数据抽取和重组对应的身份识别号进行分析的具体方法如下:

S401、通过数据整合分析模型:Yb=k3*Rb+k4*Ub,根据数据整合分析模型计算得到数据信息的整合度,并且根据数据信息的整合度将身份识别号从高到低依次进行排序,选取整合度最高的身份识别号作为数据主干,除整合度最高的身份识别号之外的其他身份识别号作为枝干;将枝干中的数据全部整合到主干中,选取枝干中特定子集中的数据信息进行抽取,将抽取到的枝干中特定子集中的数据信息发送到主干中目的位置进行处理;其中K3和K4分别为用户所属不同身份识别号产生数据信息中的传输链路个数和身份识别号重要程度与数据信息整合度之间的系数;

S402、主干对枝干传送的数据信息清洗后进行存储保存完成对计算机设备中用户所属不同身份识别号对应数据源中的数据信息整合,其中所述数据信息清洗为对枝干传送的数据信息与主干的数据信息进行相似度比较,对枝干传送的数据信息与主干的数据信息相似度为1的数据进行剔除。

2.一种应用权利要求1所述的基于互联网的计算机数据整合管理方法的计算机数据整合管理系统,其特征在于:所述计算机数据整合管理系统包括数据采集模块、数据传输模块、数据分析模块和数据整合模块;所述数据采集模块是对计算机设备数据源前端数据信息、数据源日志中的数据信息以及用户所属不同身份识别号产生的数据信息中传输链路个数进行采集;所述数据传输模块是将需要进行整合的身份识别号对应的数据信息传输到被整合的身份识别号数据信息中;所述数据分析模块是分析出在计算机设备数据源中同一用户所属的身份识别号进行分析并且对用户所属不同身份识别号的重要程度进行分析;所述数据整合模块是对用户所属不同身份识别号中需要进行数据整合的身份识别号进行分析筛选。

3.根据权利要求2所述的计算机数据整合管理系统,其特征在于:所述数据采集模块包括数据源前端数据采集单元、数据源日志信息采集单元和传输链路采集单元;所述数据源前端数据采集单元是对计算机设备中任意一个数据源前端埋点采集在计算机设备数据源前端发生的用户行为;所述数据源日志信息采集单元是对用户所属不同身份识别号在数据源中登录后产生的数据信息进行采集;所述传输链路采集单元是对用户所属不同身份识别号在数据源中登录后产生的数据信息之间传输链路的个数进行采集。

4.根据权利要求3所述的计算机数据整合管理系统,其特征在于:所述数据传输模块包括数据存储单元和数据传输单元;所述数据存储单元是将采集的计算机设备数据源前端数据信息、数据源日志中的数据信息以及用户所属不同身份识别号产生的数据信息中传输链路个数的数据信息进行存储;所述数据传输单元是在对用户所属不同身份识别号进行数据整合的时候,对需要整合的数据进行传输到指定位置。

5.根据权利要求4所述的计算机数据整合管理系统,其特征在于:所述数据分析模块包括数据信息量分析单元、用户所属不同身份识别号分析单元和身份识别号重要程度分析单元;所述数据信息量分析单元是根据用户在计算机设备数据源中登录产生的数据信息量进行分析;所述用户所属不同身份识别号分析单元是对计算机设备数据源中所有的身份识别号进行分析得到每个用户所属的不同身份识别号;所述身份识别号重要程度分析单元是对用户所属的身份识别号的重要程度进行分析。

6.根据权利要求5所述的计算机数据整合管理系统,其特征在于:所述数据整合模块包括数据整合分析单元和身份识别号整合筛选单元;所述数据整合分析单元是对身份识别号需要整合的数据信息进行分析;所述身份识别号整合筛选单元是在对用户所属不同身份识别号的重要程度对与数据整合无关的身份识别号进行筛选。