期刊文章详细信息
文献类型:期刊文章
机构地区:[1]北京大学计算语言学研究所,北京100871
基 金:国家"九七三"重点基础研究发展规划项目 (G1 9980 30 50 4 0 1 ;G1 9980 30 50 7 4)资助
年 份:2003
卷 号:26
期 号:12
起止页码:1722-1727
语 种:中文
收录情况:BDHX、BDHX2000、CSA、CSA-PROQEUST、CSCD、CSCD2011_2012、EI、IC、INSPEC、JST、MR、RCCSE、SCOPUS、ZGKJHX、核心刊
摘 要:采用最大熵模型实现中文组块分析的任务 .首先明确了中文组块的定义 ,并且列出了模型中所有的组块类型和组块标注符号 .组块划分和识别的过程可以转化为对于每一个词语赋予一个组块标注符号的过程 ,我们可以把它作为一个分类问题根据最大熵模型来解决 .最大熵模型的关键是如何选取有效的特征 ,文中给出了相关的特征选择过程和算法 .最后给出了系统实现和实验结果 .
关 键 词:自然语言处理 最大熵模型 组块分析 句法分析 信息处理
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...