期刊文章详细信息
汉语文本可读性特征体系构建和效度验证
Development of Linguistic Features System for Chinese Text Readability Assessment and Its Validity Verification
文献类型:期刊文章
Wu Siyuan;Yu Dong;Jiang Xin
机构地区:[1]北京语言大学汉语国际教育研究院 [2]北京语言大学信息科学学院
基 金:国家社科基金重大项目(项目批准号17ZDA305);教育部人文社会科学研究青年基金项目(19YJCZH230);北京语言大学一流学科团队支持计划(GF201906)的支持
年 份:2020
卷 号:34
期 号:1
起止页码:81-97
语 种:中文
收录情况:BDHX、BDHX2017、CSA、CSA-PROQEUST、CSSCI、CSSCI2019_2020、NSSD、RCCSE、RWSKHX、SKJJZZ、ZGKJHX、核心刊
摘 要:本文研究如何利用汉语文本的语言特征对文本的可读性进行分析。首先从汉字、词汇、句法和篇章四个层面出发,构建了一个预测汉语文本可读性的多层面、多维度特征体系,该特征体系包含13个维度共104项指标。然后以12个年级的语文教材语料库为基础,通过建立机器学习模型考察不同层面、不同维度语言特征的预测能力。实验结果显示:汉字、词汇、句法和篇章四个层面中,基于词汇层面特征的模型准确率最高,基于篇章层面特征的模型准确率最低;13个维度中,预测准确率最高的前5个维度依次为汉字熟悉度、汉字多样性、词汇多样性、短语句法结构复杂度和词汇熟悉度。我们还发现,四个层面语言特征对低难度文本的预测能力均最强。
关 键 词:汉语文本可读性 语言特征 机器学习 效度验证
分 类 号:G63[教育学类]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...