期刊文章详细信息
融合音节特征的最大熵藏文词性标注研究
Fusion of Syllable Features for Tibetan Part of Speech Based on Maximum Entropy Model
文献类型:期刊文章
机构地区:[1]西北民族大学中国民族语言文字信息技术重点实验室,甘肃兰州730030 [2]中国科学院自动化研究所模式识别国家重点实验室,北京100190
基 金:国家自然科学基金资助项目(61032008,61262054)
年 份:2013
卷 号:27
期 号:5
起止页码:160-165
语 种:中文
收录情况:BDHX、BDHX2011、CSCD、CSCD2013_2014、JST、RCCSE、ZGKJHX、核心刊
摘 要:藏文词性标注是藏文信息处理中非常重要的基础性问题,该文以最大熵模型为基本框架,根据藏文的构词特征及统计分析结果,定义并选取特征模板,研究了融合语言特征的最大熵藏文词性标注模型。实验结果表明,最大熵模型能够较好的处理藏文词性标注问题,音节特征可以显著提高藏文词性标注的效果,与基准系统相比使错误率降低了6.4%。
关 键 词:藏文 词性标注 最大熵 形态特征
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...