期刊文章详细信息
文献类型:期刊文章
机构地区:[1]西藏民族学院图书馆 [2]西藏民族学院信息工程学院 [3]西北民族大学藏语言文化学院
基 金:教育部人文社科一般项目"网络环境下特定主题的藏文信息发现与采集方法研究"(No:13XZJC870001)的阶段性成果
年 份:2014
期 号:21
起止页码:42-46
语 种:中文
收录情况:BDHX、BDHX2011、CSSCI、CSSCI2014_2016、RCCSE、RWSKHX、ZGKJHX、核心刊
摘 要:文章归纳整理了面向Web的藏文文本对分词系统的要求,对比参照其他藏文分词系统的优缺点并借鉴汉语分词系统的一些好的方法,设计开发了一个面向藏文网页的自动分词系统。该系统结合藏语语句特点,首先利用特征词进行了文本分块,然后对语块内文本综合运用统计与词典匹配的方法实现了藏文的自动分词。实验测试结果表明该系统明显提升了Web文本的分词效果。
关 键 词:藏文 特征词 WEB 自动分词
分 类 号:G254[图书情报与档案管理类]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...