ods层: 数据来源及建模方式:各业务系统的源数据,物理模型与业务模型一致; 服务领域: 为其它逻辑层提供数据; 数据ETL过程描述:把业务数据抽取落地成文本文件,再装载到数据仓库ods层,不做清洗转化。 功能: 1)ods是数仓准备区 2)为dwd提供原始数据 3)减少 ...
一 数仓为什么分层 怎么分层 数仓的作用 数仓的架构 数据采集层 数据存储与分析 对于hive的操作,最传统的方式是采用MapReduce 也可以通过SparkSQL操作hive 最常用的是使用Presto操作Hive 数仓分层的好处,为什么要对其进行分层 对数据仓库有一定的要求 高效率:不同的粒度 高质量:数据清洗 ETL加工,在各层进行数据治理,避免用户做出错误决策 高扩展性:存算能力 支持组 ...
2022-01-10 22:19 0 1196 推荐指数:
ods层: 数据来源及建模方式:各业务系统的源数据,物理模型与业务模型一致; 服务领域: 为其它逻辑层提供数据; 数据ETL过程描述:把业务数据抽取落地成文本文件,再装载到数据仓库ods层,不做清洗转化。 功能: 1)ods是数仓准备区 2)为dwd提供原始数据 3)减少 ...
1.分层目的 数据能够有秩序地流转,数据的整个生命周期能够清晰明确被设计者和使用者感知到 层次清晰、依赖关系直观 2.分层的优点: 清晰数据结构:每一个数据分层都有它的作用域和职责,在使用表的时候能更方便地定位和理解 减少重复开发:规范数据分层,开发一些通用的中间层数据 ...
1 、为什么要分层 我们对数据进行分层的一个主要原因就是希望在管理数据的时候,能对数据有一个更加清晰的掌控,详细来讲,主要有下面几个原因: 清晰数据结构:每一个数据分层都有它的作用域,这样我们在使用表的时候能更方便地定位和理解。 数据血缘追踪:简单 ...
1、概述 数据仓库中,常见的分层包括ods、dwd、dws、dwt、ads、dim等 2、传统上的数据分层 早期的大数据平台是以hadoop为核心,数据开发也是以MapReduce为主,hive等sql类开发很少见。 因为当数据从多个源头采集上来之后,格式化便成了原始数据。 原始数据 ...
------------恢复内容开始------------ 一、各个层作用 ODS:直接加载的是采集到的原始数据,数据保存原貌不做处理,就一个字段(一行就是一个日志字符串),使用天作为分区表,一般为json数据 DWD:对ods的数据进行展开 例如:如果采集的日志分类型的,可以根据事件 ...
目前主流的数据仓库分层大多为四层,也有五层的架构,这里介绍基本的四层架构。 分别为数据贴源层(ods)、数据仓库明细层(dw)、多维明细层(dws)和数据集市层(dm)。 下面是架构图: 数据分层的目的是:减少重复计算,避免烟囱式开发,节省计算资源,靠上层次,越对应 ...
目录 一、数据仓库之数仓分层 (一)为什么要分层? (二)数仓三层 1、数据运营层:ODS(Operational Data Store) 2、数据仓库层:DW(Data Warehouse) 3、数据 ...
一、ODS层 1、保持数据原貌,不做任何修改 2、数据压缩:LZO压缩,减少磁盘空间 3、创建的是分区表:可以防止后续的全表扫描 包括 用户行为:string line dt ods_start; ods_event(商品列表、商品详情 ...