登录    注册    忘记密码

期刊文章详细信息

语料库中熟语的标记问题    

Tagging of the Idiom in the Corpus

  

文献类型:期刊文章

作  者:安娜[1] 刘海涛[1] 侯敏[1]

机构地区:[1]北京广播学院应用语言学系,北京100024

出  处:《中文信息学报》

基  金:国家广电总局社科项目资助 (bw0 2 2 0 );国家语委科研规划项目资助 (YB10 5 - 6 1A)

年  份:2004

卷  号:18

期  号:1

起止页码:20-25

语  种:中文

收录情况:BDHX、BDHX2000、CSCD、CSCD2011_2012、JST、RCCSE、ZGKJHX、核心刊

摘  要:熟语是自然语言中普遍存在的语言现象。本文分析了国内现有语料库对熟语的标注方式 ,发现这种方式对语料库的进一步加工是有问题的。为了在语料库标注阶段把熟语问题处理好 ,本文从信息处理的角度将熟语中的成语、惯用语、歇后语、习用语、专门语以及缩略语归为固定语的范畴 ,进而提出根据固定语的语法功能给定词性标记 ,再根据它们的词汇特征给定词汇范畴标记的双层标记法 ,这样在一定程度上解决了熟语的语料库标注问题。

关 键 词:人工智能 自然语言处理 熟语 固定语 标注  语料库

分 类 号:TP391]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心