期刊文章详细信息
先秦词汇的时代特征自动获取及文献时代的自动判定
The Automatic Acquisition of Pre-Qin Word's Property of Times and The Automatic Classification of Document's Times
文献类型:期刊文章
机构地区:[1]南京师范大学语言信息科技研究中心,江苏南京210097 [2]南京大学计算机软件新技术国家重点实验室,江苏南京210093 [3]南京师范大学计算机科学与技术学院,江苏南京210097
基 金:国家社科基金资助项目(10CYY021、10&ZD117);江苏省哲社重点研究基地课题资助项目(2010JDXM023);南京大学计算机软件新技术国家重点实验室开放课题资助项目(KFKT2011B03);中国博士后基金资助项目(2012M510178);江苏省博士后基金资助项目(1101065C);江苏高校优势学科建设工程;江苏省普通高校研究生科研创新计划项目(CXLX12_0357)
年 份:2013
卷 号:27
期 号:5
起止页码:107-113
语 种:中文
收录情况:BDHX、BDHX2011、CSCD、CSCD2013_2014、JST、RCCSE、ZGKJHX、核心刊
摘 要:词汇的时代特征能反应词汇在一个时代发展变化的规律。该文将先秦分为前春秋、春秋和战国三个时代,获取并研究这三个时代的时代独有词、时代特征词及时代发源词。该文提出两种自动判断先秦文献时代的方法,分别基于向量相似度和朴素贝叶斯分类器,在25种先秦文献上后者的分类性能更稳定。最后该文使用朴素贝叶斯分类器验证了《列子》并非成书于先秦。
关 键 词:先秦词汇 时代 向量空间模型 朴素贝叶斯分类器
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...