期刊文章详细信息

基于多特征的自适应新词识别 ( EI收录)
Adaptive Method for Chinese New Word Identification Based on Multi-features

文献类型：期刊文章

作　　者：罗智勇[1] 宋柔[2]

机构地区：[1]北京工业大学计算机学院,北京100022 [2]北京语言大学语言信息处理研究所,北京100083

出　　处：《北京工业大学学报》

基　　金：国家自然科学基金(60272055;60572159);国家'八六三'计划资助项目(2001AA114111);教育部科学技术研究重点项目(00128;107017).

年　　份：2007

卷　　号：33

期　　号：7

起止页码：718-725

语　　种：中文

收录情况：AJ、BDHX、BDHX2004、CAS、CSA、CSA-PROQEUST、CSCD、CSCD2011_2012、EI(收录号：20073410776228)、IC、INSPEC、JST、MR、RCCSE、SCOPUS、ZGKJHX、ZMATH、核心刊

摘　　要：为提高自动分词系统对未登录词的识别性能,提出和实现了一种基于多特征的自适应新词识别方法,综合考虑了被处理文本中重复字符串的上下文统计特征(上下文熵)、内部耦合特征(似然比)、背景语料库对比特征(相关频率比值)以及自动分词系统辅助的边界确认信息等,并直接从被抽取文本中自动训练识別模型．同时,新词识别过程在字串PAT-Array数据结构上进行,可以抽取任意长度的新词语．实验结果表明,该方法新词发现速度快、节省存储空间．

关键词：自然语言处理系统计算语言学词语处理新词识别多特征自适应自动分词

分类号：TP391.12]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

重庆科技学院机构知识库

期刊文章详细信息

基于多特征的自适应新词识别 ( EI收录)
Adaptive Method for Chinese New Word Identification Based on Multi-features

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

重庆科技学院机构知识库

期刊文章详细信息

基于多特征的自适应新词识别 ( EI收录) Adaptive Method for Chinese New Word Identification Based on Multi-features

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

基于多特征的自适应新词识别 ( EI收录)
Adaptive Method for Chinese New Word Identification Based on Multi-features