期刊文章详细信息
基于无向图序列标注模型的中文分词词性标注一体化系统 ( EI收录)
Joint Chinese Word Segmentation and POS Tagging System with Undirected Graphical Models
文献类型:期刊文章
机构地区:[1]教育部-微软语言语音重点实验室哈尔滨工业大学,哈尔滨150001
基 金:国家自然科学基金(60773069;60973169)资助课题
年 份:2010
卷 号:32
期 号:3
起止页码:700-704
语 种:中文
收录情况:BDHX、BDHX2008、CSA、CSA-PROQEUST、CSCD、CSCD2011_2012、EI、IC、JST、RCCSE、SCOPUS、WOS、ZGKJHX、核心刊
摘 要:在中文词法分析中,分词是词性标注必须经历的阶段。为了能在分词阶段就充分利用词性标注的信息和减少两阶段错误的累计,最好的方法是将两个阶段,整合到一个架构中。该文以无向图模型为基础,将分词和词性标注有机地统一在一个序列标注模型中。由于可以采用更深层次的依赖关系作为特征,一体化系统在1998年人民日报语料上取得了97.19%的分词精确率和95.34%的词性标注精确率,是目前同类系统,在这一语料上取得的最好结果。
关 键 词:中文分词 词性标注 一体化系统 无向图模型
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...