期刊文章详细信息
文献类型:期刊文章
机构地区:[1]南通大学楚辞研究中心 [2]南通大学图书馆 [3]南京大学信息管理学院
基 金:江苏省高校哲学社会科学重点研究基地重大项目“楚辞数字化处理与应用研究”(项目编号:2010JDXM037);国家社会科学基金项目“楚辞文献语义化研究”(项目编号:10BTQ031)研究成果之一
年 份:2014
卷 号:58
期 号:4
起止页码:105-110
语 种:中文
收录情况:BDHX、BDHX2011、CSSCI、CSSCI2014_2016、JST、RCCSE、RWSKHX、ZGKJHX、核心刊
摘 要:研究古代和现代汉语的自动分词标注技术,用隐马尔科夫模型对《楚辞》进行自动分词标注实验,通过比较分词后的标注词性概率,取最大概率作为最后的分词和词性标注结果,并在其中使用全切分和加值平滑算法。经过实验调整分词标注程序模块和参数,最终得到一个分词标注辅助软件,其开放测试的分词F值为85%,标注F值为55%,高出基准F值14个百分点。
关 键 词:隐马尔科夫模型 楚辞 自动分词 词性标注 古文分词
分 类 号:TP391.1]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...