期刊文章详细信息
文献类型:期刊文章
机构地区:[1]南开大学计算机与系统科学系,天津300071
基 金:天津自然科学技术基金项目 (0 0 3 70 0 111);(993 60 0 811)和 (0 0 3 60 0 3 11)资助
年 份:2002
卷 号:23
期 号:6
起止页码:683-686
语 种:中文
收录情况:AJ、BDHX、BDHX2000、CSA、CSA-PROQEUST、CSCD、CSCD2011_2012、IC、INSPEC、JST、RCCSE、SCOPUS、ZGKJHX、核心刊
摘 要:Internet的发展为人们提供了大量的信息资源 ,Web文本挖掘是从非结构化的文本中发现潜在的、有价值知识的一种有效技术 .本文以矢量空间模型为 Web文本的表示方法 ,提出了一个基于遗传算法的 Web文本特征抽取算法 ,进一步提高了 Web文本的处理效率 ,为文本的分类、聚类以及其它处理提供了简练的特征表示方法 .实验证明 ,该种处理方法有效地降低了文本特征矢量的维数 .
关 键 词:WEB 文本信息 特征获取算法 遗传算法 INTERNET WWW
分 类 号:TP393.4]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...