原文:Data LakeHouse_理解湖倉一體

Data Lakehouse 湖倉一體 是數據管理領域中的一種新架構范例,結合了Data Warehouse和Data Lakes的最佳特性。數據分析師和數據科學家可以在同一個數據存儲中對數據進行操作,同時它也能為公司進行數據治理帶來更多的便利性。 背景 在Databricks的過去幾年中,我們看到了一種新的數據管理范式,該范式出現在許多客戶和案例中:LakeHouse。在這篇文章中,我們將描述這 ...

2021-03-07 16:23 0 551 推薦指數:

查看詳情

一體Data LakeHouse),到底是在聊什么?

Data Lakehouse一體)是新出現的一種數據架構,它同時吸收了數據倉庫和數據的優勢,數據分析師和數據科學家可以在同一個數據存儲中對數據進行操作,同時它也能為公司進行數據治理帶來更多的便利性。那么何為Data Lakehouse呢,它具備些什么特性呢? 具備哪些特性? 一直以來 ...

Fri Mar 11 22:06:00 CST 2022 0 1285
【詳談 Delta Lake 】系列技術專題 之 一體Lakehouse

簡介: 本文翻譯自大數據技術公司 Databricks 針對數據 Delta Lake 的系列技術文章。眾所周知,Databricks 主導着開源大數據社區 Apache Spark、Delta Lake 以及 ML Flow 等眾多熱門技術,而 Delta Lake 作為數據核心存儲引擎 ...

Mon Jul 05 19:22:00 CST 2021 0 216
汽車之家:基於 Flink + Iceberg 的一體架構實踐

簡介: 由汽車之家實時計算平台負責人邸星星在 4 月 17 日上海站 Meetup 分享的,基於 Flink + Iceberg 的一體架構實踐。 內容簡要: 一、數據倉庫架構升級的背景 二、基於 Iceberg 的一體架構實踐 三、總結與收益 ...

Thu Jun 10 18:03:00 CST 2021 0 174
離線實時一體化數一體—雲原生大數據平台的持續演進

​簡介:阿里雲智能研究員 林偉 :阿里巴巴從的演進給我們帶來了一體的思考,使得的靈活性、數據種類豐富與的可成長性和企業級管理得到有機融合,這是阿里巴巴最佳實踐的寶貴資產,是大數據的新一代架構。 ​ 林偉,阿里雲智能研究員、阿里雲智能通用計算平台MaxCompute ...

Tue Nov 23 19:02:00 CST 2021 0 150
37 手游基於 Flink CDC + Hudi 一體方案實踐

​簡介: 介紹了 37 手游為何選擇 Flink 作為計算引擎,並如何基於 Flink CDC + Hudi 構建新的一體方案。 本文作者是 37 手游大數據開發徐潤柏,介紹了 37 手游為何選擇 Flink 作為計算引擎,並如何基於 Flink CDC + Hudi 構建新的一體 ...

Fri Sep 24 18:51:00 CST 2021 0 158
 
粵ICP備18138465號   © 2018-2026 CODEPRJ.COM