登录    注册    忘记密码

期刊文章详细信息

面向Web的藏文文本分词策略研究    

The Study of Word Segmentation Strategy for Texts in Tibetan Based on Web

  

文献类型:期刊文章

作  者:艾金勇[1] 陈小莹[2] 华侃[3]

机构地区:[1]西藏民族学院图书馆 [2]西藏民族学院信息工程学院 [3]西北民族大学藏语言文化学院

出  处:《图书馆学研究》

基  金:教育部人文社科一般项目"网络环境下特定主题的藏文信息发现与采集方法研究"(No:13XZJC870001)的阶段性成果

年  份:2014

期  号:21

起止页码:42-46

语  种:中文

收录情况:BDHX、BDHX2011、CSSCI、CSSCI2014_2016、RCCSE、RWSKHX、ZGKJHX、核心刊

摘  要:文章归纳整理了面向Web的藏文文本对分词系统的要求,对比参照其他藏文分词系统的优缺点并借鉴汉语分词系统的一些好的方法,设计开发了一个面向藏文网页的自动分词系统。该系统结合藏语语句特点,首先利用特征词进行了文本分块,然后对语块内文本综合运用统计与词典匹配的方法实现了藏文的自动分词。实验测试结果表明该系统明显提升了Web文本的分词效果。

关 键 词:藏文 特征词 WEB 自动分词

分 类 号:G254[图书情报与档案管理类]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心