登录    注册    忘记密码

期刊文章详细信息

基于词袋模型和TF-IDF的短文本分类研究    

Research on Short Text Classification Based on Bag of Words and TF-IDF

  

文献类型:期刊文章

作  者:黄春梅[1] 王松磊[1]

HUANG Chunmei;WANG Songlei(College of Computer Science and Information Engineering,Harbin Normal University,Harbin 150025,China)

机构地区:[1]哈尔滨师范大学计算机科学与信息工程学院

出  处:《软件工程》

基  金:国家自然科学基金项目(61202458/61403109);黑龙江省自然科学基金项目(F2017021)

年  份:2020

卷  号:23

期  号:3

起止页码:1-3

语  种:中文

收录情况:普通刊

摘  要:自然语言处理是人工智能领域中的一个热门方向,而文本分类作为自然语言处理中的关键技术受到专家学者的广泛关注。随着计算机网络的发展,海量的文本踊跃出来。文本越来越多,通过人工对文本进行分类的成本越来越高。本文针对短文本分类问题,使用词袋模型从词向量中提取词频矩阵,删除停止词与低频词。再使用TF-IDF算法提取文本特征,进行文本分类研究,最终可以使短文本以较高的正确率归类。

关 键 词:自然语言处理 短文本分类  词袋模型  TF-IDF

分 类 号:TP391.1]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心