登录    注册    忘记密码

期刊文章详细信息

基于统计感知的大数据系统计算框架  ( EI收录)  

A statistical aware based big data system computing framework

  

文献类型:期刊文章

作  者:魏丞昊[1] 黄哲学[1] 何玉林[1]

WEI Chenghao;HUANG Zhexue;HE Yulin(College of Computer Science and Software Engineering,Shenzhen University,Shenzhen 518060,Guangdong Province,P.R.China)

机构地区:[1]深圳大学计算机与软件学院大数据技术与应用研究所,广东深圳518060

出  处:《深圳大学学报(理工版)》

基  金:国家自然科学基金资助项目(61503252;61473194);国家重点研发计划资助项目(2017YFC0822604-2);深圳大学新引进教师科研启动资助项目(2018060)~~

年  份:2018

卷  号:35

期  号:5

起止页码:441-443

语  种:中文

收录情况:AJ、BDHX、BDHX2017、CAS、CSA-PROQEUST、CSCD、CSCD_E2017_2018、EI、IC、INSPEC、JST、MR、RCCSE、SCOPUS、ZGKJHX、ZMATH、核心刊

摘  要:为在一定计算资源条件下实现大数据可计算化,本研究提出一种基于统计感知思想的Tbyte级大数据系统计算框架Bigdata-α,该框架的核心为大数据随机样本划分模型和逼近式集成学习模型.前者保证了划分后每个子数据块所包含的样本与大数据总体概率分布的一致性.后者通过分析若干个随机样本数据块替代了Tbyte级全量数据分析.使用1 Tbyte模拟数据集验证随机样本划分模型的有效性,通过逐渐增加随机样本块的个数,提升了Higgs数据集基分类器的分类准确度,证明该方法能克服大数据分析中计算资源的限制瓶颈.

关 键 词:计算机系统结构 大数据 随机样本划分  逼近式集成学习  并行分布式计算  分布式处理系统

分 类 号:TP311]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心