原文:Iceberg概述

背景 随着大数据领域的不断发展, 越来越多的概念被提出并应用到生产中而数据湖概念就是其中之一, 其概念参照阿里云的简介: 数据湖是一个集中式存储库, 可存储任意规模结构化和非结构化数据, 支持大数据和AI计算.数据湖构建服务 Data Lake Formation, DLF 作为云原生数据湖架构核心组成部分, 帮助用户简单快速地构建云原生数据湖解决方案. 数据湖构建提供湖上元数据统一管理 企业级权 ...

2021-11-05 18:00 0 1741 推荐指数:

查看详情

Flink集成Iceberg

Flink: 1.11.0 Iceberg: 0.11.1 hive: 2.3.8 hadoop: 3.2.2 java: 1.8 scala: 2.11 一、下载或编译iceberg-flink-runtime jar包 下载 ...

Wed May 12 19:02:00 CST 2021 0 427
iceberg数据存储格式

  Apache Iceberg作为一款新兴的数据湖解决方案在实现上高度抽象,在存储上能够对接当前主流的HDFS,S3文件系统并且支持多种文件存储格式,例如Parquet、ORC、AVRO。相较于Hudi、Delta与Spark的强耦合,Iceberg可以与多种计算引擎对接,目前社区已经支持 ...

Tue Oct 26 00:30:00 CST 2021 0 2226
数据湖| Iceberg

1. Iceberg构建数据湖 核心思想 在时间轴上跟踪表的所有变化; 快照表示表数据文件的一个完整集合; 每次更新操作会生成一个新的快照; 特性 ① 优化数据入库流程 Iceberg提供ACID事务能力,上游数据写入即可见,不影响当前数据处理任务,这大大简化 ...

Mon Sep 27 05:36:00 CST 2021 0 315
Flink集成Iceberg简介

1. 概述 Apache Iceberg is an open table format for huge analytic datasets. Iceberg adds tables to Presto and Spark that use a high-performance format ...

Wed Mar 17 22:48:00 CST 2021 0 4443
Flink 读写 iceberg

iceberg 0.11 发布的时候稍微尝试了一下,发现实际并没有说的那么厉害,很多功能其实还在开发中(比如: upsert) 贴段之前写的 flink sql: 注: 貌似没有 hive catalog,只能放在 hadoop 上面,不支持 upsert iceberg master ...

Wed Jan 05 18:31:00 CST 2022 0 4566
数据湖 Iceberg

目录 数据湖(datalake) 对象存储 Iceberg 功能 Schema 变更 隐式分区和分区布局变更 查询特定版本和版本回滚 Iceberg in Spark 表格式说明 数据湖(datalake) 传统数据库 ...

Wed Jan 26 07:54:00 CST 2022 0 1106
iceberg数据读取流程

metadata_location 属性,通过这个属性可以拿到 iteblog 表的 Iceberg 的 metadata 相关路 ...

Tue Nov 30 01:53:00 CST 2021 0 1147
iceberg文件详解

一、数据内容 t20 ├── data │ ├── 00000-0-9c7ff22e-a767-4b85-91ec-a2771e54c209-00001.parquet ...

Wed May 19 09:35:00 CST 2021 0 1381
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM