登录    注册    忘记密码

期刊文章详细信息

正则表达式在Web信息抽取中的应用    

Regular expression and its applications to web information extraction

  

文献类型:期刊文章

作  者:胡军伟[1] 秦奕青[1] 张伟[1]

机构地区:[1]北京信息科技大学计算机学院,北京100192

出  处:《北京信息科技大学学报(自然科学版)》

基  金:北京市教育科技计划面上项目(KM201110772014)

年  份:2011

卷  号:26

期  号:6

起止页码:86-89

语  种:中文

收录情况:CSA、CSA-PROQEUST、JST、普通刊

摘  要:针对基于HTML结构的信息抽取方法,提出了正则表达式的处理方法。利用正则表达式的匹配、替换和提取等功能,重点讨论了正则表达式在Web信息抽取过程中的应用。正则表达式已成功的应用在数据搜集、页面优化、规则学习和信息抽取等整个Web信息抽取的过程中。

关 键 词:WEB信息抽取 正则表达式 匹配  替换  提取  

分 类 号:TP311]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心