期刊文章详细信息
文献类型:期刊文章
机构地区:[1]苏州大学智能信息处理及应用研究所,江苏苏州215006
基 金:教育部科研重点项目(205059);教育部"高校博士学科点科研基金项目"(20040285016);江苏省高技术研究计划项目(BG2005019)
年 份:2007
卷 号:17
期 号:5
起止页码:148-151
语 种:中文
收录情况:JST、RCCSE、ZGKJHX、普通刊
摘 要:传统搜索引擎仅可以索引浅层Web页面,然而在网络深处隐含着大量、高质量的信息,传统搜索引擎由于技术原因不能索引这些被称之为Deep Web的页面。由于查询接口是Deep Web的唯一入口,因此要获取Deep Web信息就需判定哪些网页表单是Deep Web查询接口。文中介绍了一种利用朴素贝叶斯分类算法自动判定网页表单是否为Deep Web查询接口的方法,并实验验证了该方法的有效性。
关 键 词:深网 网页表单 特征提取 朴素贝叶斯分类
分 类 号:TP181]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...