期刊文章详细信息
文献类型:期刊文章
DONG Yi;LIU Jingfa;LIU Wenjie(School of Computer and Software,Nanjing University of Information Science and Technology,Nanjing 210044,China;Guangzhou Key Laboratory of Multilingual Intelligent Processing,Guangzhou 510006,China;School of Information Science and Technology,Guangdong University of Foreign Studies,Guangzhou 510006,China)
机构地区:[1]南京信息工程大学计算机与软件学院,南京210044 [2]广东外语外贸大学广州市非通用语种智能处理重点实验室,广州510006 [3]广东外语外贸大学信息科学与技术学院,广州510006
基 金:国家社会科学基金(16ZDA047);江苏省自然科学基金(BK20181409,BK20171458);广州市科技计划项目(202002030238);广州市非通用语种智能处理重点实验室专项(201905010008)。
年 份:2020
卷 号:46
期 号:9
起止页码:274-282
语 种:中文
收录情况:AJ、BDHX、BDHX2017、CAS、CSCD、CSCD_E2019_2020、IC、JST、RCCSE、SCOPUS、UPD、ZGKJHX、核心刊
摘 要:基于关键词匹配检索的传统搜索引擎爬全率和爬准率较低,而使用基于语义检索的主题爬虫方法容易偏离主题与陷入局部最优。针对该问题,提出一种采用多目标蚁群优化算法的主题爬虫方法。构建主题爬虫领域本体和主题向量,以链接的锚文本相关度、链接所在网页主题相关度以及链接指向网页主题相关度为指标判断链接是否与主题相关,并建立链接主题相关度的多目标优化模型,将基于多目标优化的蚁群算法引入主题爬虫的链接选择过程,采用非支配排序和最近最远候选解法选取Pareto最优链接,以引导主题爬虫搜索方向并提升全局搜索性能。实验结果表明,与FCSA、WSE等传统主题爬虫方法相比,该方法爬准率更高,并且能更快抓取到主题相关度高的网页。
关 键 词:主题爬虫 蚁群算法 多目标优化 暴雨灾害 本体构建
分 类 号:TP391.3]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...