原文:【大数据面试】【数仓项目】分层:ODS层、DWD层、DWS层、ADS层构成、操作

一 ODS层 保持数据原貌,不做任何修改 数据压缩:LZO压缩,减少磁盘空间 创建的是分区表:可以防止后续的全表扫描 包括 用户行为:string line dt ods start ods event 商品列表 商品详情 点击 广告 点赞 评论 收藏 业务数据: 张表 用户 支付 订单表 订单详情 商品表 商品一二三级分类 二 DWD层 ETL对数据的核心字段进行清洗 去重 去空 ETL工具是什 ...

2021-12-16 17:17 0 1321 推荐指数:

查看详情

大数据开发-ads指标计算

ads数据往往是最终的结果指标数据,在大屏展示,或者实时流处理时候使用,通过下面两个例子来练习业务大屏展示sql该怎么写。 1.会员分析案例 1.1 数据准备 表结构如下,其中此表是dws以天为维度的会员表,比如每天的会员信息汇总, 1.2 会员指标计算 沉默会员的定义:只在安装 ...

Mon Dec 14 07:56:00 CST 2020 0 395
4.Hive中的ODSDWDDWSADS 分层

1、数据仓库   我们常提的(DataWarehouse),就是在我们已有的数据库(他是对数据的存储)的基础之上,增加了对数据的OLAP(On-Line Analytical Processing),支持复杂的数据分析操作,更侧重决策支持,提供直观易懂的查询结果,而数据库更着重的是事务处理 ...

Thu Sep 30 01:50:00 CST 2021 0 572
大数据实时项目(ads)

第一章 ADS 聚合 ads,主要是根据各种报表及可视化来生成统计数据。通常这些报表及可视化都是基于某些维度的汇总统计。 1 需求 热门商品统计(作业) 热门品类统计(作业) 热门品牌统计 交易用户性别对比(作业) 交易用户年龄段对比(作业) 交易额省市 ...

Tue Nov 10 00:23:00 CST 2020 0 1269
1.2 |分层| ODS& DWD& DWS& ADS| 行为

分层 ODS:Operation Data Store原始数据 DWD(数据清洗/DWI) data warehouse detail数据明细详情,去除空值,脏数据,超过极限范围的明细解析具体表 DWS(宽表-用户行为,轻度聚合) data warehouse service ...

Sun Mar 24 18:14:00 CST 2019 0 21861
【转】详解数中的数据分层ODSDWD、DWM、DWSADS

简书上一篇博文讲,我觉得和之前转的一篇帆软的博文也是挺有参考和学习价值的。讲清楚了每个分层的概念和做什么。 这是博文的出处https://www.jianshu.com/p/1dd894e5bb62 --------------------------------------------------------------------------------------------- ...

Tue Jan 25 01:16:00 CST 2022 0 798
数据仓库 业务 DWD

业务DWD一般有两个典型操作: ①因为是DWD,所以要进行数据清洗。 ②因为数据来源于web项目数据库,标的设计遵循三范式,因此在数里需要进行降维,以减少join次数。 在示例的8张表中,订单表,订单详情表,用户表,支付流水表字段与ODS一致。对商品表的分类进行降维。增加二级 ...

Thu Jul 02 07:04:00 CST 2020 0 1569
数据仓库 业务 ODS

ODS数据不做任何处理,完全仿照业务数据库中的表字段,一模一样的创建ODS对应表。 8张表建表语句: ①用sqoop把导入到HDFS的时候,加了参数--fields-terminated-by "\t",因此这里ODS建表的时候也注意相同的分隔符。 ②不管是全量导入还是其他形式,都使 ...

Thu Jul 02 06:38:00 CST 2020 0 633
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM