期刊文章详细信息
统计与规则相结合的藏文人名自动识别研究
Automatic recognition of tibetan name with the combination of statistics and regular
文献类型:期刊文章
机构地区:[1]甘肃同元信息系统技术有限责任公司 [2]西北民族大学中国民族语言文字信息技术重点实验室,兰州730030 [3]周口师范学院计算机科学技术系,周口466001
基 金:国家自然科学基金(60970071)
年 份:2010
卷 号:11
期 号:2
起止页码:113-115
语 种:中文
收录情况:普通刊
摘 要:提出了一种基于统计与规则相结合的藏文人名自动识别方法。该方法充分挖掘了人名与上下文信息的关联程度,引入互信息对关联程度进行了定量的描述。根据大规模语料(30.2 M文本语料)的统计数据所建立的规则极大地提高了识别算法的准确率;在处理汉族音译人名情况时,采用姓氏驱动的方法,很好地解决了藏文文本中汉族人名的识别问题。实验结果表明,该方法具有较高的准确率和召回率。
关 键 词:藏文人名识别 互信息 格助词 人名词典
分 类 号:TP391.4]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...