会议论文详细信息
文献类型:会议
作者单位:清华大学人文学院中国语言文学系,北京 100084
会议文献:第十八届中国计算语言学大会暨中国中文信息学会2019学术年会论文集
会议名称:第十八届中国计算语言学大会暨中国中文信息学会2019学术年会
会议日期:20191018
会议地点:昆明
主办单位:中国中文信息学会
出版日期:20191018
语 种:中文
摘 要:该文从鲁迅书信、小说和杂文中提取出387个语言特征,采用随机森林和k-means聚类算法筛选出58个能够对三种文体取得较好区别效果的特征.该文采用比伯的多维度分析法对这些语言特征进行因子分析,得到7个比较重要的因子.该文根据每个因子中具有显著负荷值的语言特征,将7个因子解释为4个能够体现文体在写作角度、叙述视角、形式、语言系统等方面差异的维度,和3个能够体现文体存在某种特点的特征组合.书信和小说在互动性上相似,然而书信更具议论性、文言性和详细的写作特征,小说更具描写性、白话性和简短的写作特征;书信和杂文在议论性和详细的写作特征上相似,而书信互动性较强,杂文互动性较弱;小说和杂文则没有相似的维度.
关 键 词:鲁迅作品 文体特征 语体属性
分 类 号:I210]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...