期刊文章详细信息
文献类型:期刊文章
机构地区:[1]北京理工大学计算机学院,北京100081 [2]北京戏曲艺术职业学院,北京100068 [3]北京联合大学师范学院,北京100011
基 金:北京市优秀人才培养计划基金资助项目(2012D002002000001);北京市职业院校教师素质提高工程基金资助项目
年 份:2013
卷 号:39
期 号:6
起止页码:266-271
语 种:中文
收录情况:AJ、CAS、CSA、CSA-PROQEUST、CSCD、CSCD2013_2014、IC、INSPEC、JST、RCCSE、SCOPUS、UPD、ZGKJHX、普通刊
摘 要:针对机构命名实体识别效率低的问题,提出一种基于隐马尔科夫模型(HMM)的京剧机构命名实体识别算法。利用HMM模型标注文本切分结果的词性消除歧义,通过Viterbi算法计算某种分词结果所对应的可能性最大的词性序列。根据定制的名称识别规则,借助机构前缀词库、后缀词库获得机构名称左右边界,通过自动机算法识别语料中的机构命名实体,并将新词加载到分词词典中。针对京剧领域语料进行开放测试验证,结果表明,该算法的识别正确率可达到99%。
关 键 词:开放领域 命名实体识别 隐马尔科夫模型 VITERBI算法 规则树
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...