期刊文章详细信息
文献类型:期刊文章
机构地区:[1]南京邮电大学信息网络中心,江苏南京210003 [2]南京邮电大学信息工程系,江苏南京210003
基 金:江苏省自然科学基金资助项目(01KJD520005)
年 份:2005
卷 号:5
期 号:4
起止页码:61-64
语 种:中文
收录情况:AJ、CAS、CSA、CSA-PROQEUST、ZMATH、普通刊
摘 要:对基于朴素贝叶斯算法的垃圾邮件过滤技术进行了研究分析和实验验证.介绍了向量空间模型(VSM)方法以及特征向量抽取方法,推导和研究了引入“特征之间互相独立”假设的朴素贝叶斯分类算法.采用K次交叉验证的方法,以收集的一些邮件为语料,应用朴素贝叶斯分类算法,通过训练集计算得到类别的先验概率和特征项的类条件概率,并以此为基础对测试集中的邮件进行归属判断,以正确率和召回率为指标给出了实验结果.
关 键 词:垃圾邮件 文本分类 向量空间模型 贝叶斯算法
分 类 号:TP181]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...