期刊文章详细信息
文献类型:期刊文章
机构地区:[1]北京信息科技大学计算机学院,北京100192
基 金:北京市教育科技计划面上项目(KM201110772014)
年 份:2011
卷 号:26
期 号:6
起止页码:86-89
语 种:中文
收录情况:CSA、CSA-PROQEUST、JST、普通刊
摘 要:针对基于HTML结构的信息抽取方法,提出了正则表达式的处理方法。利用正则表达式的匹配、替换和提取等功能,重点讨论了正则表达式在Web信息抽取过程中的应用。正则表达式已成功的应用在数据搜集、页面优化、规则学习和信息抽取等整个Web信息抽取的过程中。
关 键 词:WEB信息抽取 正则表达式 匹配 替换 提取
分 类 号:TP311]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...