1.一种基于大数据的计算机网络安全监测方法,其特征在于:包括下列步骤:S1、采集用户输入的关键词信息,对用户通过网络发送的历史内容进行识别检测;
S2、根据识别采集的历史内容,提取历史发送内容中的关键词信息,与用户输入的关键词信息相匹配,提取包含关键词的内容;
S3、根据分析结果,对信息的相关性指数进行分析处理,对信息进行筛选;
S4、根据筛选结果,智能选择用户需要转发的内容信息,并对用户进行展示;
在步骤S2中,包括下列步骤:
S201、根据采集的用户历史发送内容,形成关键词历史文本信息;
S202、根据用户输入的关键词历史文本信息,对候选关键词信息进行选择;
S203、根据候选关键词,通过词语之间的相关度计算,对关键词进行筛选合并;
S204、通过建立关键词提取模型,对关键词进行提取,提取包含该关键词的聊天内容;
在步骤S3中,包括下列步骤:
S301、根据提取的包含关键词的内容,通过构建聊天内容知识图谱,对聊天内容进行提取;
S302、根据提取的聊天内容,对信息的相关性指数进行分析,对聊天内容进行筛选;
S303、根据筛选结果,获取需要转发的聊天内容;
在步骤S301中,包括下列步骤:
S301‑1、根据提取的包含关键词的内容,得到该内容中的词语为cx,形成集合X={c1,c2,…,cs},其中,s表示为词语数量;设置词语的向量矩阵H为uH×d矩阵,其中,uH表示为总的词语数量,d表示为知识图谱的实体和关系的嵌入维度;设置矩阵L,Li表示为实体中每个词语的出现次数;
S301‑2、通过下列公式对词语cx的嵌入表示β进行计算:β=(Li⊙Ij)H;
其中,I表示为权重矩阵,Ij表示为矩阵I中的元素,⊙表逐个元素相乘;
S301‑3、通过下列公式对评分函数f进行计算:
f=‑τ||β1‑β2||‑(1‑τ)||β头‑v+β尾||;
其中,τ表示为权重参数,β1表示为头实体在文本信息的嵌入表示,β2表示为尾实体在文本信息的嵌入表示,β头表示为头实体在知识图谱的嵌入表示,β尾表示为尾实体在知识图谱的嵌入表示;v表示为知识图谱中的关系的向量;
S301‑4、设置输入三元组集合为Z,正确三元组为z正,错误三元组为z错;
通过下列公式对损失函数f损进行计算:
其中,γ表示为超参数,f正表示为正确三元组的评分函数,f正(z正)表示自变量为z正时的评分函数f正的值,f错表示为错误三元组的评分函数,f错(z错)表示自变量为z错时的评分函数f错的值;
S301‑5、根据分析结果,构建聊天内容知识图谱,提取出与关键词相关的聊天内容。
2.根据权利要求1所述的一种基于大数据的计算机网络安全监测方法,其特征在于:在步骤S302中,包含下列步骤:S302‑1、设置时间间隔为t,将聊天内容按照时间间隔进行分区,并进行编号,通过下列公式对内容概率P进行计算:其中,X表示为在设置时间间隔内的编号模拟值,μ表示为聊天内容的编号,θ表示为时间间隔内的平均关键词数量;
对每个时间间隔的聊天内容概率进行计算,将概率由高到低进行排序,实现对聊天内容的优先级排序;
S302‑2、根据提取的聊天内容,从优先级最高的时间间隔的聊天内容开始进行筛选;
对信息集A中的元素进行排序,得到等级a;未包含关键词的聊天内容为信息集B,对信息集B中的元素进行排序,得到等级b;
S302‑3、通过下列公式对内容相关性指数ω进行计算:
其中,δ表示为信息集中的数据个数;
S302‑4、设置内容相关性指数阈值为ω阈,当ω≥ω阈时,表示聊天内容与包含关键词的内容相关,保持选择,反之,当ω<ω阈时,表示聊天内容与包含关键词的内容不相关,取消选择。
3.根据权利要求2所述的一种基于大数据的计算机网络安全监测方法,其特征在于:在步骤S4中,根据筛选结果,选择用户需要转发的内容信息,通过计算机屏幕向用户进行提示,并将分析结果进行加密存储,按照优先级由高到低进行排序展示,用户选择需要转发的聊天记录。
4.一种实现权利要求1‑3任一项所述的一种基于大数据的计算机网络安全监测方法的基于大数据的计算机网络安全监测系统,其特征在于:所述网络安全监测系统包括:信息采集模块和数据分析模块;
所述信息采集模块的输出端与数据分析模块的输入端相连接;
所述信息采集模块用于采集用户使用计算机时的数据信息,包括历史内容采集单元和关键词采集单元,所述历史内容采集单元用于采集用户的历史聊天内容,所述关键词采集单元用于采集用户输入的关键词信息;
所述数据分析模块用于对采集的数据进行分析处理,包括关键词提取单元和内容筛选单元,所述关键词提取单元用于根据用户输入的关键词信息,对历史聊天内容中的关键词内容进行提取,所述内容筛选单元用于对内容相关性指数进行分析,筛选出与关键词相关的聊天内容。
5.根据权利要求4所述的一种基于大数据的计算机网络安全监测系统,其特征在于:所述网络安全监测系统还包括:数据库;所述数据库输入端与信息采集模块的输出端相连接,数据库输入端与数据分析模块的输出端相连接;
所述数据库用于对采集的数据和分析结果进行加密存储,包括数据加密单元和数据存储单元,所述数据加密单元通过ECC加密算法,对数据采集和数据分析的过程进行加密;所述数据存储单元通过散列存储方法,对采集的数据和分析结果进行存储,系统通过不断存储的数据,通过聚类算法进行机器学习。
6.根据权利要求5所述的一种基于大数据的计算机网络安全监测系统,其特征在于:所述网络安全监测系统还包括:转发显示模块;所述转发显示模块的输入端与数据分析模块的输出端相连接;
所述转发显示模块用于根据分析结果,通过时间节点选择聊天内容,对用户展示转发结果,包括内容选择单元和屏幕展示单元,所述内容选择单元用于根据分析的聊天内容优先级,将最终分析的聊天内容进行排序,用户根据优先级由高到低进行选择,所述屏幕展示单元用于将最终分析选择的转发聊天记录对用户进行展示。