登录    注册    忘记密码

期刊文章详细信息

基于支持向量机的中文极短文本分类模型    

Classification model based on support vector machine for Chinese extremely short text

  

文献类型:期刊文章

作  者:王杨[1] 许闪闪[1] 李昌[1] 艾世成[1] 张卫东[1] 甄磊[1] 孟丹[1]

Wang Yang;Xu Shanshan;Li Chang;Ai Shicheng;Zhang Weidong;Zhen Lei;Meng Dan(School of Information&Computer Science,Anhui Normal University,Wuhu Anhui 241000,China)

机构地区:[1]安徽师范大学计算机与信息学院,安徽芜湖241000

出  处:《计算机应用研究》

基  金:国家自然科学基金资助项目(61871412);安徽省自然科学基金资助项目(1808085MF178);安徽省人文社科基金资助项目(SK2014ZD033,AHSKY2017D42).

年  份:2020

卷  号:37

期  号:2

起止页码:347-350

语  种:中文

收录情况:AJ、BDHX、BDHX2017、CSA-PROQEUST、CSCD、CSCD_E2019_2020、IC、INSPEC、JST、RCCSE、UPD、ZGKJHX、ZMATH、核心刊

摘  要:为了有效提取极短文本中的关键特征信息,提出了一种基于支持向量机的极短文本分类模型。首先对原数据进行数据清洗并利用jieba分词将清洗过的数据进行处理;再将处理后的数据存入数据库,通过TF-IDF进行文本特征的提取;同时,利用支持向量机对极短文本进行分类。经过1-0检验,验证了模型的有效性。实验以芜湖市社管平台中的9906条极短文本数据作为样本进行算法检验与分析。结果表明在分类准确率方面,该方法相比于朴素贝叶斯、逻辑回归、决策树等传统方法得到有效提高;在误分度与精确度指标上匹配结果更加均衡。

关 键 词:支持向量机 jieba分词  极短文本分类  TF-IDF

分 类 号:TP391.1] TP181[计算机类]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心