期刊文章详细信息
文献类型:期刊文章
Cai Minguan;Wang Peng(Dept.of Information Center,University of Yanbian,Yanji Jilin 133002,China;College of Engineering,University of Yanbian,Yanji Jilin 133002,China)
机构地区:[1]延边大学信息化中心,吉林延吉133002 [2]延边大学工学院,吉林延吉133002
基 金:吉林省教育厅基金资助项目(JJKH20220540CY,JJKH20230622KJ)。
年 份:2023
卷 号:40
期 号:12
起止页码:3529-3538
语 种:中文
收录情况:AJ、BDHX、BDHX2020、CSCD、CSCD_E2023_2024、JST、RCCSE、UPD、ZGKJHX、ZMATH、核心刊
摘 要:传统存储技术已经不适合大数据时代的数据分析和应用,数据湖概念的出现有效解决了数据存储成本高、灵活性低、异构数据多样化等问题。目前数据湖研究还处于早期阶段,缺乏覆盖数据处理全过程的综述性研究。为了更全面地了解数据湖技术,调查分析了近几年数据湖技术的研究成果。首先,梳理了数据湖发展历程和概念,并与其他类似的概念进行了比较;其次,对数据湖架构进行了调查,并根据架构特征把数据湖关键技术分为存储、数据摄取、数据维护、数据探索、数据治理等部分,分析和讨论了关键技术的最新研究进展、技术方案、研究缺陷以及今后研究方向;最后,调查了数据湖在各个应用领域的典型应用,为各行业数据湖的实施者提供了参考。
关 键 词:数据湖 元数据管理 数据组织 数据发现 数据探索
分 类 号:TP311]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...