登录    注册    忘记密码

期刊文章详细信息

基于jieba中文分词的中文文本语料预处理模块实现    

  

文献类型:期刊文章

作  者:石凤贵[1]

机构地区:[1]马鞍山师范高等专科学校软件工程系,安徽马鞍山243041

出  处:《电脑知识与技术》

基  金:安徽省教育厅科学研究项目资助(KJ2017A852)。

年  份:2020

卷  号:16

期  号:14

起止页码:248-251

语  种:中文

收录情况:普通刊

摘  要:文本预处理是文本分析理解的基础,预处理结果可以直接影响到文本分析的准确率。中文文本语句结构复杂,词语之间没有明显的分隔标记,需要进行分词来理解语句。分词是文本预处理的基础,词的切分准确性影响文本预处理结果。本文分词采用jieba中文分词工具,实现了文本预处理模块。

关 键 词:文本分词  文本预处理 去停用词  

分 类 号:TP181]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心