期刊文章详细信息
文献类型:期刊文章
机构地区:[1]太原理工大学计算机科学与技术学院,太原030024
基 金:国家重点实验室开放课题(SKLSE2012-09-30)资助项目;山西省自然科学基金(2013-011015-2)资助项目;太原理工大学"语言信息处理学科建设和研究"专项项目资助
年 份:2014
卷 号:29
期 号:1
起止页码:71-75
语 种:中文
收录情况:AJ、BDHX、BDHX2011、CSA、CSA-PROQEUST、CSCD、CSCD2013_2014、IC、INSPEC、JST、RCCSE、SCOPUS、ZGKJHX、核心刊
摘 要:针对在文本分类中先验概率的计算比较费时而且对分类效果影响不大、后验概率的精度损失影响分类准确率的现象,对经典朴素贝叶斯分类算法进行了改进,提出了一种"先抑后扬"(抑制先验概率的作用,扩大后验概率的影响)的文本分类算法。算法中去掉了对先验概率的计算,并在后验概率的计算中引入了一个放大系数。实验结果表明,分类时不计算先验概率对分类精度影响甚微但可以明显加快分类的速度,在后验概率的计算中引入放大系数减少了误差传播的影响,提高了分类精度。
关 键 词:文本分类 朴素贝叶斯 先验概率 后验概率
分 类 号:TP391.1]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...