期刊文章详细信息
文献类型:期刊文章
机构地区:[1]华中师范大学网络与通信研究所,武汉430079 [2]武汉大学计算机学院,武汉430072
基 金:软件工程国家重点实验室开放基金资助项目
年 份:2006
卷 号:32
期 号:20
起止页码:43-44
语 种:中文
收录情况:AJ、BDHX、BDHX2004、CAS、CSA、CSA-PROQEUST、CSCD、CSCD2011_2012、EI(收录号:20065110317762)、IC、INSPEC、JST、RCCSE、SCOPUS、UPD、ZGKJHX、核心刊
摘 要:由于存在着大量的在线信息,WWW成为数据挖掘的热点。该文介绍了Web网页的数据挖掘技术,提出一种基于XML的Web数据挖掘模型,阐述将半结构化HTML文档转换成良构的XML文档的原因,并给出基于HTMLTide库的转换代码,介绍了利用XML技术从Web网页析取数据的关键技术,包括XHTML、XSLT和XQuery等,对Web数据挖掘的其他方面如数据检验和集成作了一定的探讨。
关 键 词:WEB数据挖掘 XML模型 关键技术
分 类 号:TP311]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...