期刊文章详细信息
文献类型:期刊文章
机构地区:[1]北京理工大学珠海学院会计与金融学院,珠海519088 [2]北京理工大学管理学院,北京100081
基 金:国家自然科学基金项目(项目编号:71972011);广东省普通高校人文社会科学重点研究基地项目(项目编号:2023WZJD009);广东省实验教学示范中心(智能财经人才实验教学示范中心)项目;北京理工大学珠海学院校级质量工程项目(项目编号:2023006ZLGC,2023008ZLGC)。
年 份:2024
卷 号:45
期 号:11
起止页码:17-25
语 种:中文
收录情况:BDHX、BDHX2023、NSSD、RCCSE、RWSKHX、核心刊
摘 要:大语言模型(Large Language Models,LLMs)目前正在重塑各行各业的学习方式、思维模式和研究范式。如何使LLMs与行业结合、重构LLMs与行业的关系,是推动企业数字化变革和社会发展的重要命题。要实现LLMs在垂域发挥重要作用,最重要的是提升LLMs的推理能力。本文以如何提升LLMs在会计领域的推理能力为起点,提出会计垂域推理能力的概念、研究路径、评测标准,分析中文开源模型清华智谱的GLM系列的评测结果,为后续的推理研究提供标准范式,并为如何提升会计推理能力提供评价标准,力图推动LLMs在会计领域达到应有水平。同时,为验证LLMs的会计推理能力,本文比较了GLM-6B、GLM-130B、GLM-4在算术推理能力和会计常识推理能力方面的差别,并将OPENAI的GPT-4作为基准进行分析。结果表明,在不同推理提示工程下,模型规模显著影响推理能力,虽然各种模型算术推理能力已经得到极大的提高,但是会计推理能力还远不能达到应用水平,需要在应用中逐层优化,研究为LLMs会计垂域进入应用实践的优化过程提供参考。
关 键 词:大语言模式 垂域模型 推理能力 提示词工程 会计推理能力 基准数据集
分 类 号:TP18] F231]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...