登录    注册    忘记密码

期刊文章详细信息

汉语文本可读性特征体系构建和效度验证    

Development of Linguistic Features System for Chinese Text Readability Assessment and Its Validity Verification

  

文献类型:期刊文章

作  者:吴思远[1,2] 于东[2] 江新[1]

Wu Siyuan;Yu Dong;Jiang Xin

机构地区:[1]北京语言大学汉语国际教育研究院 [2]北京语言大学信息科学学院

出  处:《世界汉语教学》

基  金:国家社科基金重大项目(项目批准号17ZDA305);教育部人文社会科学研究青年基金项目(19YJCZH230);北京语言大学一流学科团队支持计划(GF201906)的支持

年  份:2020

卷  号:34

期  号:1

起止页码:81-97

语  种:中文

收录情况:BDHX、BDHX2017、CSA、CSA-PROQEUST、CSSCI、CSSCI2019_2020、NSSD、RCCSE、RWSKHX、SKJJZZ、ZGKJHX、核心刊

摘  要:本文研究如何利用汉语文本的语言特征对文本的可读性进行分析。首先从汉字、词汇、句法和篇章四个层面出发,构建了一个预测汉语文本可读性的多层面、多维度特征体系,该特征体系包含13个维度共104项指标。然后以12个年级的语文教材语料库为基础,通过建立机器学习模型考察不同层面、不同维度语言特征的预测能力。实验结果显示:汉字、词汇、句法和篇章四个层面中,基于词汇层面特征的模型准确率最高,基于篇章层面特征的模型准确率最低;13个维度中,预测准确率最高的前5个维度依次为汉字熟悉度、汉字多样性、词汇多样性、短语句法结构复杂度和词汇熟悉度。我们还发现,四个层面语言特征对低难度文本的预测能力均最强。

关 键 词:汉语文本可读性  语言特征 机器学习  效度验证

分 类 号:G63[教育学类]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心