期刊文章详细信息

Web页面主题信息抽取研究与实现
Research and Implementation of Extracting Topical Information from Web Page

文献类型：期刊文章

作　　者：刘艳敏[1] 刘飚[2] 封化民[3] 宋国森[1] 方勇[2]

机构地区：[1]燕山大学信息工程学院,河北秦皇岛066004 [2]北京邮电大学电信工程学院,北京100876 [3]北京电子科技学院信息安全与保密重点实验室,北京100070

出　　处：《计算机工程与应用》

基　　金：国家自然科学基金资助项目(编号:60472082)

年　　份：2006

卷　　号：42

期　　号：21

起止页码：146-148

语　　种：中文

收录情况：AJ、BDHX、BDHX2004、CSA、CSA-PROQEUST、CSCD、CSCD2011_2012、IC、INSPEC、JST、RCCSE、ZGKJHX、核心刊

摘　　要：Web页面中的主要信息通常隐藏在大量无关的特征中,如无关紧要的图片和不相关的连接,使用户不能迅速获取主题信息,限制了Web的可用性。论文提出一种网页主题内容提取的方法及相应算法,并通过人工判定的方法对来自120个网站的5000个网页进行了测试和评估。实验结果表明该方法切实可行,可达到91.35%的准确率。

关键词：HTML 信息提取页面结构分析标记统计

分类号：TP311] TP393[计算机类]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

重庆科技学院机构知识库

期刊文章详细信息

Web页面主题信息抽取研究与实现
Research and Implementation of Extracting Topical Information from Web Page

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

重庆科技学院机构知识库

期刊文章详细信息

Web页面主题信息抽取研究与实现 Research and Implementation of Extracting Topical Information from Web Page

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

Web页面主题信息抽取研究与实现
Research and Implementation of Extracting Topical Information from Web Page