登录    注册    忘记密码

期刊文章详细信息

基于HMM的楚辞自动分词标注研究    

Research on Automatic Word Segmentation and Pos Tagging for Chu Ci Based on HMM

  

文献类型:期刊文章

作  者:钱智勇[1,2] 周建忠[1] 童国平[3] 苏新宁[3]

机构地区:[1]南通大学楚辞研究中心 [2]南通大学图书馆 [3]南京大学信息管理学院

出  处:《图书情报工作》

基  金:江苏省高校哲学社会科学重点研究基地重大项目“楚辞数字化处理与应用研究”(项目编号:2010JDXM037);国家社会科学基金项目“楚辞文献语义化研究”(项目编号:10BTQ031)研究成果之一

年  份:2014

卷  号:58

期  号:4

起止页码:105-110

语  种:中文

收录情况:BDHX、BDHX2011、CSSCI、CSSCI2014_2016、JST、RCCSE、RWSKHX、ZGKJHX、核心刊

摘  要:研究古代和现代汉语的自动分词标注技术,用隐马尔科夫模型对《楚辞》进行自动分词标注实验,通过比较分词后的标注词性概率,取最大概率作为最后的分词和词性标注结果,并在其中使用全切分和加值平滑算法。经过实验调整分词标注程序模块和参数,最终得到一个分词标注辅助软件,其开放测试的分词F值为85%,标注F值为55%,高出基准F值14个百分点。

关 键 词:隐马尔科夫模型 楚辞 自动分词 词性标注 古文分词  

分 类 号:TP391.1]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心