原文:【数仓面试】数仓分层架构、作用、数据采集层、数据存储与分析、数仓分层的好处

一 数仓为什么分层 怎么分层 数仓的作用 数仓的架构 数据采集层 数据存储与分析 对于hive的操作,最传统的方式是采用MapReduce 也可以通过SparkSQL操作hive 最常用的是使用Presto操作Hive 数仓分层的好处,为什么要对其进行分层 对数据仓库有一定的要求 高效率:不同的粒度 高质量:数据清洗 ETL加工,在各层进行数据治理,避免用户做出错误决策 高扩展性:存算能力 支持组 ...

2022-01-10 22:19 0 1196 推荐指数:

查看详情

分层架构

ods数据来源及建模方式:各业务系统的源数据,物理模型与业务模型一致; 服务领域: 为其它逻辑提供数据数据ETL过程描述:把业务数据抽取落地成文本文件,再装载到数据仓库ods,不做清洗转化。 功能: 1)ods是准备区 2)为dwd提供原始数据 3)减少 ...

Fri Oct 11 23:28:00 CST 2019 0 2725
分层

1.分层目的 数据能够有秩序地流转,数据的整个生命周期能够清晰明确被设计者和使用者感知到 层次清晰、依赖关系直观 2.分层的优点: 清晰数据结构:每一个数据分层都有它的作用域和职责,在使用表的时候能更方便地定位和理解 减少重复开发:规范数据分层,开发一些通用的中间层数据 ...

Fri May 17 19:12:00 CST 2019 0 2464
3、-分层设计

1 、为什么要分层 我们对数据进行分层的一个主要原因就是希望在管理数据的时候,能对数据有一个更加清晰的掌控,详细来讲,主要有下面几个原因: 清晰数据结构:每一个数据分层都有它的作用域,这样我们在使用表的时候能更方便地定位和理解。 数据血缘追踪:简单 ...

Wed May 20 00:23:00 CST 2020 0 724
分层

1、概述 数据仓库中,常见的分层包括ods、dwd、dws、dwt、ads、dim等 2、传统上的数据分层 早期的大数据平台是以hadoop为核心,数据开发也是以MapReduce为主,hive等sql类开发很少见。 因为当数据从多个源头采集上来之后,格式化便成了原始数据。 原始数据 ...

Tue Jun 23 19:04:00 CST 2020 0 1766
分层的理解

------------恢复内容开始------------ 一、各个作用 ODS:直接加载的是采集到的原始数据数据保存原貌不做处理,就一个字段(一行就是一个日志字符串),使用天作为分区表,一般为json数据 DWD:对ods的数据进行展开 例如:如果采集的日志分类型的,可以根据事件 ...

Tue Aug 11 06:21:00 CST 2020 0 931
数据仓库(6)分层设计

  目前主流的数据仓库分层大多为四,也有五架构,这里介绍基本的四架构。 分别为数据贴源(ods)、数据仓库明细(dw)、多维明细(dws)和数据集市(dm)。   下面是架构图:   数据分层的目的是:减少重复计算,避免烟囱式开发,节省计算资源,靠上层次,越对应 ...

Thu Apr 14 20:03:00 CST 2022 0 848
数据仓库之分层及hive分层

目录 一、数据仓库之分层 (一)为什么要分层? (二) 1、数据运营:ODS(Operational Data Store) 2、数据仓库:DW(Data Warehouse) 3、数据 ...

Mon Aug 02 17:27:00 CST 2021 0 559
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM