期刊文章详细信息
文献类型:期刊文章
机构地区:[1]东华大学计算机科学与技术学院,上海201620
基 金:国家核高基项目(2010ZX01042-001-003)
年 份:2013
卷 号:35
期 号:10
起止页码:25-35
语 种:中文
收录情况:BDHX、BDHX2011、CSCD、CSCD2013_2014、ZGKJHX、核心刊
摘 要:一个大数据解决方案需要面对三个关键问题:大数据的存储、大数据的分析和大数据的管理。首先综述了大数据和Hadoop生态系统的定义;然后从商业产品和Hadoop生态系统两个方面来探讨如何面对大数据,重点分析了Hadoop生态系统是如何解决的:分别用HDFS、HBase和OpenTSDB解决存储问题,用Hadoop MapReduce(Hive)和HadoopDB解决分析问题,用Sqoop和Ganglia等解决管理问题。对于每个成员,分别分析了其系统架构、实现原理和特点;对于重点成员,分别分析了其存在的一些问题或缺点,并在总结当前学术和应用的进展基础上,结合我们自身的研究进展,提出了解决方法、解决思路和观点。可以预见,Hadoop生态系统将是中小企业在面对大数据问题时的首选解决方案。
关 键 词:大数据 Hadoop生态系统 MAPREDUCE HDFS 列存储数据库
分 类 号:TP311]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...