期刊文章详细信息
中文分词及词性标注一体化模型研究
Research on the Model of Integrating Chinese Word Segmentation with Part-of-speech Tagging
文献类型:期刊文章
机构地区:[1]哈尔滨工业大学(威海)计算机科学与技术学院,威海264209 [2]东北大学信息科学与工程学院,沈阳110004 [3]辽东学院计算中心,丹东118000
基 金:2002年山东省科技发展计划项目基金资助(项目号:2002-276-022090104)
年 份:2007
卷 号:34
期 号:9
起止页码:174-175
语 种:中文
收录情况:BDHX、BDHX2004、CSA、CSCD、CSCD2011_2012、IC、JST、RCCSE、UPD、ZGKJHX、核心刊
摘 要:本文应用N-最短路径法,构造了一种中文自动分词和词性自动标注一体化处理的模型,在分词阶段召回N个最佳结果作为候选集,最终的结果会在未登录词识别和词性标注之后,从这N个最有潜力的候选结果中选优得到,并基于该模型实现了一个中文自动分词和词性自动标注一体化处理的中文词法分析器。初步的开放测试证明,该分析器的分词准确率和词性标注准确率分别达到98.1%和95.07%。
关 键 词:中文分词 词性标注 N-最短路径法
分 类 号:TP311.13]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...