期刊文章详细信息
文献类型:期刊文章
机构地区:[1]湖州师范学院信息工程学院,湖州313000 [2]宁波大学网络中心,宁波315211
基 金:国家自然科学基金资助项目(60573056),浙江省自然科学基金重点资助项目(Z106335),浙江省自然科学基金(Y105625).
年 份:2007
卷 号:26
期 号:5
起止页码:723-727
语 种:中文
收录情况:AJ、BDHX、BDHX2004、CSA、CSA-PROQEUST、CSSCI、CSSCI2006_2007、INSPEC、JST、NSSD、RCCSE、RWSKHX、ZGKJHX、核心刊
摘 要:互联网已经成为最大的非结构化数据库,极大方便了信息访问.然而,网络上的信息大多都是无组织的,由于网络的分布式特性,很难对它进行信息和知识管理.因此,如何建立一个智能的信息发现机制很有必要.本文在分析了爬虫工作原理和传统算法后,提出了一种基于本体的网络爬虫的信息发现框架.该框架包含了预处理模块和本体管理模块,定义了网页相关度计算策略,最后通过实验对该框架进行了评估.
关 键 词:本体 网络爬虫 语义网 信息检索
分 类 号:TP311.13]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...