期刊文章详细信息
古汉语词义标注语料库的构建及应用研究
The Construction and Application of Ancient Chinese Corpus with Word Sense Annotation
文献类型:期刊文章
SHU Lei;GUO Yiluan;WANG Huiping;ZHANG Xuetao;HU Renfen(Institute of Chinese Information Processing,Beijing Normal University,Beijing 100875,China;Institute for Advanced Study of the Humanities and Religion,Beijing Normal University,Beijing 100875,China;College of Chinese Language and Culture,Beijing Normal University,Beijing 100875,China)
机构地区:[1]北京师范大学中文信息处理研究所,北京100875 [2]北京师范大学人文宗教高等研究院,北京100875 [3]北京师范大学汉语文化学院,北京100875
基 金:国家自然科学基金(62006021);北京市社会科学基金青年学术带头人项目(21DTR037)。
年 份:2022
卷 号:36
期 号:5
起止页码:21-30
语 种:中文
收录情况:BDHX、BDHX2020、CSCD、CSCD2021_2022、JST、RCCSE、ZGKJHX、核心刊
摘 要:古汉语以单音节词为主,其一词多义现象十分突出,这为现代人理解古文含义带来了一定的挑战。为了更好地实现古汉语词义的分析和判别,该研究基于传统辞书和语料库反映的语言事实,设计了针对古汉语多义词的词义划分原则,并对常用古汉语单音节词进行词义级别的知识整理,据此对包含多义词的语料开展词义标注。现有的语料库包含3.87万条标注数据,规模超过117.6万字,丰富了古代汉语领域的语言资源。实验显示,基于该语料库和BERT语言模型,词义判别算法准确率达到80%左右。进一步地,该文以词义历时演变分析和义族归纳为案例,初步探索了语料库与词义消歧技术在语言本体研究和词典编撰等领域的应用。
关 键 词:古代汉语 语料库 词义标注 词义消歧
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...