登录    注册    忘记密码

期刊文章详细信息

一种基于XQuery的优化Web信息抽取方法    

Optimized Web information extraction based on XQuery

  

文献类型:期刊文章

作  者:支宗良[1] 陈少飞[1]

机构地区:[1]河北省烟草专卖局烟草经济信息中心,石家庄050051

出  处:《计算机应用》

年  份:2008

卷  号:28

期  号:1

起止页码:152-154

语  种:中文

收录情况:AJ、BDHX、BDHX2004、CSA、CSA-PROQEUST、CSCD、CSCD2011_2012、IC、INSPEC、JST、RCCSE、ZGKJHX、ZMATH、核心刊

摘  要:由于缺乏对页面特征适应性的分析,现有的典型系统难以保障抽取规则的健壮性。提出一种优化的Web信息抽取方法,该方法引入了相互关联的三层规则,在分析页面特征适应性的基础上,从准确率和召回率两方面出发提出了抽取规则的优化算法,并用标准XQuery表达复杂对象抽取规则。实验证明,该方法有效地增强了抽取规则的健壮性及可用性。

关 键 词:信息抽取 规则优化  XPATH XQUERY

分 类 号:TP311.135.4]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心