期刊文章详细信息
文献类型:期刊文章
机构地区:[1]中国科学院计算技术研究所,北京100080 [2]北京信息科技大学中文信息处理研究中心,北京100101
基 金:国家重点基础研究发展计划("973"计划)基金资助项目(G1998030507-4;G1998030510);计算所领域前沿青年基金资助项目(20026180-23);国家自然科学基金资助项目(60272084);北京市教育委员会科技发展计划重点项目(KZ200310772013)~~
年 份:2006
卷 号:27
期 号:2
起止页码:87-94
语 种:中文
收录情况:BDHX、BDHX2004、CSA、CSA-PROQEUST、CSCD、CSCD2011_2012、EI(收录号:20063610101514)、IC、INSPEC、JST、RCCSE、SCOPUS、ZGKJHX、核心刊
摘 要:提出了一种基于层叠隐马尔可夫模型的中文命名实体一体化识别方法,旨在将人名识别、地名识别以及机构名识别等命名实体识别融合到一个相对统一的理论模型中。首先在词语粗切分的结果集上采用底层隐马尔可夫模型识别出普通无嵌套的人名、地名和机构名等,然后依次采取高层隐马尔可夫模型识别出嵌套了人名、地名的复杂地名和机构名。在对大规模真实语料库的封闭测试中,人名、地名和机构识别的F-1值分别达到92.55%、94.53%、86.51%。采用该方法的系统ICTCLAS在2003年5月SIGHAN举办的第一届汉语分词大赛中名列前茅。
关 键 词:命名实体识别 角色标注 ICTCLAS
分 类 号:TP391.2]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...