登录    注册    忘记密码

期刊文章详细信息

面向语言文学领域的大语言模型性能评测研究    

Performance Evaluation Study of Large Language Models for the Field of Language and Literature

  

文献类型:期刊文章

作  者:赵雪[1] 赵志枭[1] 孙凤兰[2] 王东波[1]

ZHAO Xue;ZHAO Zhixiao;SUN Fenglan;WANG Dongbo

机构地区:[1]南京农业大学息管理学院,江苏省南京市210095 [2]北京外国语大学外语教学与研究出版社,北京市100089

出  处:《外语电化教学》

基  金:国家社会科学基金重大项目“中国古代典籍跨语言知识库构建及应用研究”(项目编号:21&ZD331);国家社科基金一般项目“基于语料库的中国学者学术英语口语研究”(项目编号:16BYY098)的阶段性研究成果。

年  份:2023

期  号:6

起止页码:57-65

语  种:中文

收录情况:BDHX、BDHX2020、CSSCI、CSSCI2023_2024、NSSD、RCCSE、RWSKHX、核心刊

摘  要:该研究选取16个热门大语言模型,探究其在5个典型语言处理任务上的表现,最后对参测模型进行综合评价。研究发现,闭源大模型GPT-4和GPT-3.5-Turbo综合表现最佳,开源大模型中Baichuan2-7B-Chat表现突出,Qwen-7B-Chat次之,ChatGLM2-6B和ChatGLM-6B合格。模型的领域生成能力差异巨大,该研究旨在为语言文学研究者提供模型的选择建议,促进语言文学研究与人工智能的交叉融合。

关 键 词:数字人文  AIGC  大语言模型  语言文学

分 类 号:H319.3[外国语言文学类]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心