知嘟嘟-专利交易平台_专利购买_专利出售-买专利,上嘟嘟

欢迎来到知嘟嘟！联系电话：13336804447 卖家免费入驻，海量在线求购！卖家免费入驻，海量在线求购！

嘟嘟会员

帮助中心网站地图

查出售查高校查求购查年费

我要发布

首页转移热力图Hot 专利交易委托购买高校专区科技服务专利求购年费查询行业资讯

联系电话：13336804447

知嘟嘟经纪人

基于改进特征评估函数的贝叶斯垃圾邮件过滤方法

￥38400

专利号： 2015101796889

申请人：辽宁大学

专利类型：发明专利

专利状态：已下证

专利领域：计算；推算；计数

更新日期：2024-01-05

缴费截止日期：暂无

价格&联系人

年费信息

委托购买

专利简介

专利详情

委托购买说明

需准备材料

常见问题

摘要:

权利要求书:

1.基于改进特征评估函数的贝叶斯垃圾邮件过滤方法，其特征在于，步骤如下：

1)对训练邮件集进行预处理：将邮件分为邮件头部和正文部分两个子文本集S1,S2，在其中分别进行分词，组成两个特征项集合T1，T2；

2)分别在两个特征集T1，T2中使用停用词表删除介词、代词、副词、助词，连接词以及词频低于给定的阈值p的词语，处理后的特征项集合记为T1’，T2’；

3)分别在特征项集合T1’，T2’中运用改进的特征评估函数计算出互信息值MI(tk)’：

3a)设特征向量集合T＝{tk,k＝1,2,…,n}，在网络文件文本库中获得训练集类别集合C＝{cj,i＝1,2,…,r}；

3b)利用公式(1)计算得出修正系数λ：

其中，表示特征项tk在cj里的词频数；

3c)利用公式(2)计算得出MI(tk)：

其中，P(tk|cj)为类cj内含有tk的文本概率，P(tk)为含有tk的文本在训练集类别集合里出现的概率，P(cj)为训练集类别集合里属于类别cj的文本出现概率；

3d)利用公式(3)得出tk基于训练集的互信息值MI(tk)’：其中，βi(i＝2)代表邮件头部和正文部分两个子集位置的不同权重，β1代表邮件头部的权重，β2代表正文部分的权重，且应满足β1>β2,β1+β2＝1；

4)在训练集内，计算出特征项tk相应的互信息值MI(tk)，并对其按从大到小的顺序进行排序，选择前n个值对应的特征项用于训练集的表示,得出特征属性和训练样本；

推荐专利

基于贝塞尔函数与Toeplitz算法的SFM信号参数估计方法

发明专利

￥26000

贝塞尔函数与虚拟阵列相结合的SFM信号的参数估计方法

发明专利

￥26000

针对贝叶斯网络中引入专家评价的先验概率评估方法

我要求购

我不想找了，帮我找吧

您有专利需要变现?

我要出售

智能匹配需求，快速出售

摘要:

权利要求书:

知嘟嘟

友情链接

关于我们

联系我们