登录    注册    忘记密码

期刊文章详细信息

数据挖掘技术在文本特征分析中的应用研究--以夏目漱石中长篇小说为例    

A Study on the Application of Data Mining Technology in Text Feature Analysis——Taking Natsume Soseki's Novels as an Example

  

文献类型:期刊文章

作  者:毛文伟[1]

MAO Wen-wei(Office of Research Affairs,Shanghai International Studies University,Shanghai 200083,China)

机构地区:[1]上海外国语大学科研处,上海市200083

出  处:《外语电化教学》

年  份:2018

期  号:6

起止页码:8-15

语  种:中文

收录情况:BDHX、BDHX2017、CSSCI、CSSCI2017_2018、NSSD、RCCSE、RWSKHX、核心刊

摘  要:本研究运用数据挖掘技术对夏目漱石的中长篇小说进行聚类分析,发现以1908年为界,夏目漱石的中长篇小说可分为三个时期。t检验结果显示,这些作品在名词比、动词比、修饰词比、MVR等指标方面表现较为一致。早期和过渡期作品在接续词句比、非过去式句比方面,过渡期和后期作品在非过去式结句比方面,前期和后期作品在接续词句比、非过去式句比方面存在显著性差异。对指标进行标准化后发现,它们的共性特征在于文本偏重描写,且倾向于状况描写。前期作品的句子极短,容易理解。之后的作品句子逐渐变长,但仍偏短、易懂。句子间关联性不断增强,前后意思联系更加密切,表达更加富有逻辑性。在叙事方式方面,由生动描写转向客观描写,发生了由第一人称视角向第三人称视角的转换。

关 键 词:数据挖掘 聚类分析 日本文学 文本特征

分 类 号:H319.3[外国语言文学类]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心