登录    注册    忘记密码

期刊文章详细信息

基于义原同现频率的汉语词义排歧方法  ( EI收录)  

A CHINESE WORD SENSE DISAMBIGUATION METHOD BASED ON PRIMITIVE CO-OCCURRENCE DATA

  

文献类型:期刊文章

作  者:杨尔弘[1] 张国清[2] 张永奎[1]

机构地区:[1]山西大学计算机科学系,太原030006 [2]上海师范大学计算中心,上海201418

出  处:《计算机研究与发展》

基  金:山西省青年基金项目 (2 0 0 0 10 17);山西省自然科学基金项目 (9910 35 )资助

年  份:2001

卷  号:38

期  号:7

起止页码:833-838

语  种:中文

收录情况:AJ、BDHX、BDHX2000、CSA-PROQEUST、CSCD、CSCD2011_2012、EI、IC、JST、RCCSE、SCOPUS、ZGKJHX、核心刊

摘  要:词义排岐是自然语言处理的重点和难点问题之一 .基于语料库的统计方法已被广泛地应用于词义排岐 .大多数的统计方法都受到数据稀疏的困扰 ,对于词义排岐而言 ,由于有大量同义词的存在 ,数据稀疏问题变得更为严重 .充分利用“知网”这个知识源的特性 ,提出了一种基于义原同现频率的词义排岐方法 ,在很大程度上克服了数据稀疏问题 .此外 ,该方法还避免了繁重的人工标注语料的过程 ,通过在一个约 10万字的语料库上获得义原同现频率矩阵 ,并以此作为词义排岐的依据 .实验表明 。

关 键 词:自然语言处理 知网 义原同现频率  汉语词义排歧  语料库

分 类 号:TP391.12]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心