登录    注册    忘记密码

期刊文章详细信息

COLSEC语料库的设计原则与标注方法    

Design principles and annotation methods of the COLSEC corpus

  

文献类型:期刊文章

作  者:卫乃兴[1] 李文中[2] 濮建忠[3]

机构地区:[1]上海交通大学语言文字工程研究所,上海200030 [2]河南师范大学外语学院,河南新乡市453002 [3]解放军外国语学院研究生处,河南洛阳市471003

出  处:《当代语言学》

基  金:国家社会科学基金项目(01BYY007)"大学英语学习者口语语料库"的建设方法

年  份:2007

卷  号:9

期  号:3

起止页码:235-246

语  种:中文

收录情况:BDHX、BDHX2004、CSSCI、CSSCI2006_2007、NSSD、RWSKHX、核心刊

摘  要:本文报告COLSEC语料库的设计原则与标注方法。文章描述该类语料库设计应考虑的任务场景、话语类型、话题、学习者背景等语域因素,继而讨论语料库转写与标注应遵循的"真实""准确"和"完整"原则,以及相应的头文件信息标注、话语信息标注、语音错误赋码等关键问题。我们还讨论了语料库后期加工中的赋码器选择、词类赋码格式以及转换为在线互联网资源所涉及的格式问题。文章最后阐述了基于口语语料库可进行的有关应用研究。

关 键 词:学习者口语语料库设计  转写原则  话语信息标注  语音错误赋码  词类码格式  

分 类 号:TP391.1]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心