期刊文章详细信息
具有三级索引词库结构的中文分词方法研究
Study on Chinese Word Segmentation Based on Key-word Library Having Three Level Index
文献类型:期刊文章
机构地区:[1]大庆石油学院计算机科学系,黑龙江大庆163318
基 金:国家自然科学基金资助项目(60473051)
年 份:2006
卷 号:23
期 号:8
起止页码:49-51
语 种:中文
收录情况:AJ、BDHX、BDHX2004、CSA-PROQEUST、CSCD、CSCD2011_2012、IC、INSPEC、JST、RCCSE、UPD、ZGKJHX、ZMATH、核心刊
摘 要:提出了一种分组并具有三级索引结构的词库组织体系,给出了合适的索引密度间隔;针对系统基本词库的扩充问题,考虑了一种基于词频统计并具有过滤功能的关键词自动抽取和小词条添加方法。大量仿真实验结果表明,采用该方法可较大提高中文文本的切词速度及信息的查全查准率。
关 键 词:中文切词 正向最大匹配 词库 索引密度 全文检索
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...