期刊文章详细信息
基于条件随机场的藏语自动分词方法研究与实现
Research and Implementation of Tibetan Automatic Word Segmentation Based on Conditional Random Field
文献类型:期刊文章
机构地区:[1]西北民族大学中国民族语言文字信息技术重点实验室,甘肃兰州730030 [2]中国科学院自动化研究所模式识别国家重点实验室,北京100190
基 金:国家自然基金资助项目(61032008);模式识别国家重点实验室开放课题资助项目(201001051);西北民族大学中央高校基本业务费专项资金项目(ycx11135;zyz2011101)
年 份:2013
卷 号:27
期 号:4
起止页码:52-58
语 种:中文
收录情况:BDHX、BDHX2011、CSCD、CSCD2013_2014、JST、RCCSE、ZGKJHX、核心刊
摘 要:藏语自动分词是藏语信息处理的基础性关键问题,而紧缩词识别是藏语分词中的重点和难点。目前公开的紧缩词识别方法都是基于规则的方法,需要词库支持。该文提出了一种基于条件随机场的紧缩词识别方法,并在此基础上实现了基于条件随机场的藏语自动分词系统。实验结果表明,基于条件随机场的紧缩词识别方法快速、有效,而且可以方便地与分词模块相结合,显著提高了藏语分词的效果。
关 键 词:藏语自动分词 条件随机场 紧缩词识别 格助词
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...