花费 68 ms
一文读懂大数据实时计算

​ 本文分为四个章节介绍实时计算,第一节介绍实时计算出现的原因及概念;第二节介绍实时计算的应用场景;第三节介绍实时计算常见的架构;第四节是实时数仓解决方案。 一、实时计算 实时计算一般 ...

Mon Jul 12 17:53:00 CST 2021 0 1444
基于Flink构建全场景实时数仓

目录: 一. 实时计算初期 二. 实时数仓建设 三. Lambda架构的实时数仓 四. Kappa架构的实时数仓 五. 流批结合的实时数仓 实时计算初期 虽然实时计算在最近几年才火起来, ...

Sat Jul 17 21:00:00 CST 2021 1 873
Flink 的运行架构详细剖析

1. Flink 程序结构 Flink 程序的基本构建块是流和转换(请注意,Flink 的 DataSet API 中使用的 DataSet 也是内部流 )。从概念上讲,流是(可能永无止境的)数据记 ...

Thu Nov 04 21:58:00 CST 2021 0 356
大数据中必须要掌握的 Flink SQL 详细剖析

Flink SQL 是 Flink 实时计算为简化计算模型,降低用户使用实时计算门槛而设计的一套符合标准 SQL 语义的开发语言。 自 2015 年开始,阿里巴巴开始调研开源流计算引擎,最终决定基于 ...

Fri Nov 05 21:53:00 CST 2021 0 2590
数仓建设 | ODS、DWD、DWM等理论实战(好文收藏)

本文目录: 一、数据流向 二、应用示例 三、何为数仓DW 四、为何要分层 五、数据分层 六、数据集市 七、问题总结 导读 数仓在建设过程中,对数据的组织管理上,不仅要根据业务进行纵向的主题 ...

Wed Apr 13 23:03:00 CST 2022 0 1066
Flink的应用场景和架构

Flink的应用场景 Flink项目的理念就是:Flink是为分布式,高性能,随时可用以及准确的流处理应用程序打造的开源流处理框架。自2019年开源以来,迅速成为大数据实时计算领域炙手可热的技术框架 ...

Fri Aug 21 20:12:00 CST 2020 0 625
基于 Kafka 的实时数仓在搜索的实践应用

一、概述 Apache Kafka 发展至今,已经是一个很成熟的消息队列组件了,也是大数据生态圈中不可或缺的一员。Apache Kafka 社区非常的活跃,通过社区成员不断的贡献代码和迭代项目,使得 ...

Mon Feb 28 19:25:00 CST 2022 0 903
字节跳动基于 Apache Hudi 的多流拼接实践方案

字节跳动数据湖团队在实时数仓构建宽表的业务场景中,探索实践出的一种基于 Hudi Payload 的合并机制提出的全新解决方案。 字节跳动数据湖团队在实时数仓构建宽表的业务场景中,探索实践 ...

Wed Mar 30 22:15:00 CST 2022 0 707

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM