期刊文章详细信息
融合形态特征的最大熵蒙古文词性标注模型 ( EI收录)
Fusion of Morphological Features for Mongolian Part of Speech Based on Maximum Entropy Model
文献类型:期刊文章
机构地区:[1]合肥学院计算机科学与技术系网络与智能信息处理重点实验室,合肥230601 [2]内蒙古大学蒙古学学院,呼和浩特010021 [3]中国科学院合肥物质科学研究院,合肥230001
基 金:国家自然科学基金项目(60763003);教育部人文社会科学研究基金项目(09YZC740045)
年 份:2011
卷 号:48
期 号:12
起止页码:2385-2390
语 种:中文
收录情况:AJ、BDHX、BDHX2008、CSA-PROQEUST、CSCD、CSCD2011_2012、EI、IC、JST、RCCSE、SCOPUS、ZGKJHX、核心刊
摘 要:最大熵模型以其能够较好地包容各种约束信息及与自然语言模型相适应等优点在词性标注研究中取得了良好的效果.因此,将其作为基本框架,提出了一种融合语言特征的最大熵蒙古文词性标注模型.首先,根据蒙古文构词特点及统计分析结果,定义并选取特征模板,利用训练语料提取了大量的候选特征集合,针对错误或者无效的特征通过设置一些规则筛选特征.然后,训练最大熵概率模型参数.实验结果表明,融合蒙古文形态特征的最大熵模型可以较好地标注蒙古文.
关 键 词:形态特征 最大熵模型 蒙古文 词性标注 参数估计
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...