期刊文章详细信息
文献类型:期刊文章
机构地区:[1]东南大学计算机科学与工程学院,南京210096 [2]福建工程学院计算机与信息科学系,福州350108 [3]福州大学数学与计算机科学学院,福州350108
基 金:国家自然科学基金项目(60873176);福建省教育厅科技项目(JA08161)
年 份:2011
卷 号:48
期 号:1
起止页码:45-54
语 种:中文
收录情况:AJ、BDHX、BDHX2008、CSA-PROQEUST、CSCD、CSCD2011_2012、EI、IC、JST、RCCSE、SCOPUS、ZGKJHX、核心刊
摘 要:取样是一种通用有效的近似技术.在数据挖掘研究中,取样方法可显著减小所处理数据集的规模,使得众多数据挖掘算法得以应用到大规模数据集以及数据流数据上.通过对应用于数据挖掘领域的代表性取样方法的比较研究和分析总结,提出了一个取样算法分类框架.在指出了均匀取样局限性的基础上阐述了某些应用场景中选用偏倚取样方法的必要性,综述了取样技术在数据挖掘领域的应用研究与应用发展,最后对数据流挖掘取样方法面临的挑战和发展方向进行了展望.
关 键 词:数据挖掘 均匀取样 偏倚取样 数据流 概要数据结构
分 类 号:TP311.13] TP391[计算机类]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...