期刊文章详细信息
数据挖掘技术在文本特征分析中的应用研究--以夏目漱石中长篇小说为例
A Study on the Application of Data Mining Technology in Text Feature Analysis——Taking Natsume Soseki's Novels as an Example
文献类型:期刊文章
MAO Wen-wei(Office of Research Affairs,Shanghai International Studies University,Shanghai 200083,China)
机构地区:[1]上海外国语大学科研处,上海市200083
年 份:2018
期 号:6
起止页码:8-15
语 种:中文
收录情况:BDHX、BDHX2017、CSSCI、CSSCI2017_2018、NSSD、RCCSE、RWSKHX、核心刊
摘 要:本研究运用数据挖掘技术对夏目漱石的中长篇小说进行聚类分析,发现以1908年为界,夏目漱石的中长篇小说可分为三个时期。t检验结果显示,这些作品在名词比、动词比、修饰词比、MVR等指标方面表现较为一致。早期和过渡期作品在接续词句比、非过去式句比方面,过渡期和后期作品在非过去式结句比方面,前期和后期作品在接续词句比、非过去式句比方面存在显著性差异。对指标进行标准化后发现,它们的共性特征在于文本偏重描写,且倾向于状况描写。前期作品的句子极短,容易理解。之后的作品句子逐渐变长,但仍偏短、易懂。句子间关联性不断增强,前后意思联系更加密切,表达更加富有逻辑性。在叙事方式方面,由生动描写转向客观描写,发生了由第一人称视角向第三人称视角的转换。
关 键 词:数据挖掘 聚类分析 日本文学 文本特征
分 类 号:H319.3[外国语言文学类]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...