期刊文章详细信息
文献类型:期刊文章
机构地区:[1]北京广播学院应用语言学系,北京100024
基 金:国家广电总局社科项目资助 (bw0 2 2 0 );国家语委科研规划项目资助 (YB10 5 - 6 1A)
年 份:2004
卷 号:18
期 号:1
起止页码:20-25
语 种:中文
收录情况:BDHX、BDHX2000、CSCD、CSCD2011_2012、JST、RCCSE、ZGKJHX、核心刊
摘 要:熟语是自然语言中普遍存在的语言现象。本文分析了国内现有语料库对熟语的标注方式 ,发现这种方式对语料库的进一步加工是有问题的。为了在语料库标注阶段把熟语问题处理好 ,本文从信息处理的角度将熟语中的成语、惯用语、歇后语、习用语、专门语以及缩略语归为固定语的范畴 ,进而提出根据固定语的语法功能给定词性标记 ,再根据它们的词汇特征给定词汇范畴标记的双层标记法 ,这样在一定程度上解决了熟语的语料库标注问题。
关 键 词:人工智能 自然语言处理 熟语 固定语 标注 语料库
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...