期刊文章详细信息
文献类型:期刊文章
机构地区:[1]北京大学计算语言学研究所,北京100871 [2]人民日报社新闻信息中心,北京100733
基 金:国家"八六三"高技术研究发展计划项目基金 (2 0 0 1AA1 1 4 2 1 0 0 5);国家"九七三"重点基础研究发展规划项目基金 (G1 9980 30 50 4 0 1;G1 9980 30 50 7 4)资助
年 份:2004
卷 号:27
期 号:9
起止页码:1192-1197
语 种:中文
收录情况:BDHX、BDHX2000、CSA、CSA-PROQEUST、CSCD、CSCD2011_2012、EI(收录号:2004488687392)、IC、INSPEC、JST、MR、RCCSE、SCOPUS、ZGKJHX、核心刊
摘 要:关键词是文档管理、文本聚类 /分类、信息检索等领域可利用的重要资源 ,因此该文提出了利用最大熵模型进行自动标引的技术 .最大熵模型为一个成熟的数学模型 ,已经应用到计算语言学的各个领域 .然而它的应用非常灵活 ,针对标引任务和现有资源的实际情况 ,作者首先建立了最大熵模型的特征集合 ,然后提出了三种试验方法 ,并给出了相应的试验结果 ,最后针对最大熵模型在关键词自动标引任务中的应用做了有益的分析和探讨 .该研究对于关键词标引研究以及最大熵在其他领域中的应用将有所启示 .
关 键 词:关键词标引 关键词抽取 最大熵模型 信息抽取
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...