期刊文章详细信息

正则表达式在Web信息抽取中的应用
Regular expression and its applications to web information extraction

文献类型：期刊文章

作　　者：胡军伟[1] 秦奕青[1] 张伟[1]

机构地区：[1]北京信息科技大学计算机学院,北京100192

出　　处：《北京信息科技大学学报（自然科学版）》

基　　金：北京市教育科技计划面上项目(KM201110772014)

年　　份：2011

卷　　号：26

期　　号：6

起止页码：86-89

语　　种：中文

收录情况：CSA、CSA-PROQEUST、JST、普通刊

摘　　要：针对基于HTML结构的信息抽取方法,提出了正则表达式的处理方法。利用正则表达式的匹配、替换和提取等功能,重点讨论了正则表达式在Web信息抽取过程中的应用。正则表达式已成功的应用在数据搜集、页面优化、规则学习和信息抽取等整个Web信息抽取的过程中。

关键词：WEB信息抽取正则表达式匹配替换提取

分类号：TP311]

正在载入数据...

正在载入数据...

正在载入数据...

正在载入数据...

正在载入数据...

正在载入数据...