登录    注册    忘记密码

期刊文章详细信息

一种基于TF-IDF的朴素贝叶斯算法改进    

An Improved Naive Bayes Algorithm Based on TF-IDF

  

文献类型:期刊文章

作  者:许甜华[1] 吴明礼[1]

XU Tian-hua;WU Ming-li(School of Informatics,North China University of Technology,Beijing 100144,China)

机构地区:[1]北方工业大学信息学院

出  处:《计算机技术与发展》

基  金:国家自然科学基金(61672040)

年  份:2020

卷  号:30

期  号:2

起止页码:75-79

语  种:中文

收录情况:JST、RCCSE、ZGKJHX、普通刊

摘  要:目前对以朴素贝叶斯算法为代表的文本分类算法,普遍存在特征权重一致,考虑指标单一等问题。为了解决这个问题,提出了一种基于TF-IDF的朴素贝叶斯改进算法TF-IDF-DL朴素贝叶斯算法。该算法以TF-IDF为基础,引入去中心化词频因子和特征词位置因子以加强特征权重的准确性。为了验证该算法的效果,采用了搜狗实验室的搜狗新闻数据集进行实验,实验结果表明,在朴素贝叶斯分类算法中引入TF-IDF-DL算法,能够使该算法在进行文本分类中的准确率、召回率和F 1值都有较好的表现,相比国内同类研究TF-IDF-dist贝叶斯方案,分类准确率提高8.6%,召回率提高11.7%,F 1值提高7.4%。因此该算法能较好地提高分类性能,并且对不易区分的类别也能在一定程度上达到良好的分类效果。

关 键 词:朴素贝叶斯 TF-IDF算法  去中心化 位置信息 特征权重  

分 类 号:TP391]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心