登录    注册    忘记密码

期刊文章详细信息

中文新词识别技术综述    

Survey of Chinese New Words Identification

  

文献类型:期刊文章

作  者:张海军[1,2] 史树敏[3] 朱朝勇[1] 黄河燕[3]

机构地区:[1]中国科学技术大学计算机科学与技术学院,合肥230027 [2]新疆师范大学计算机系,乌鲁木齐830054 [3]中国科学院计算机语言信息工程研究中心,北京100097

出  处:《计算机科学》

基  金:国家自然科学基金项目(60672149);国家863计划重点项目(2006AA010109)资助

年  份:2010

卷  号:37

期  号:3

起止页码:6-10

语  种:中文

收录情况:BDHX、BDHX2008、CSA、CSCD、CSCD2011_2012、IC、JST、UPD、ZGKJHX、核心刊

摘  要:新词识别是中文信息处理领域的关键技术。新词识别主要包括候选字串的提取过滤和词性猜测两项任务。中文没有特定符号标志词边界,因此任何相邻字符都有成词的可能性,这给新词提取过滤带来了很大困难;由于没有先验知识和统计数据,新词词性猜测一直是中文词性标注的技术瓶颈。详细分析了中文新词识别技术的研究现状,重点讨论了候选新词提取和词性猜测的研究方法与存在的主要问题,最后对新词识别研究方向进行了展望。

关 键 词:新词识别 未登录词 候选字串  训练语料  词性猜测  

分 类 号:TP391.1]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心