ads层数据往往是最终的结果指标数据,在大屏展示,或者实时流处理时候使用,通过下面两个例子来练习业务大屏展示sql该怎么写。 1.会员分析案例 1.1 数据准备 表结构如下,其中此表是dws层以天为维度的会员表,比如每天的会员信息汇总, 1.2 会员指标计算 沉默会员的定义:只在安装 ...
一 ODS层 保持数据原貌,不做任何修改 数据压缩:LZO压缩,减少磁盘空间 创建的是分区表:可以防止后续的全表扫描 包括 用户行为:string line dt ods start ods event 商品列表 商品详情 点击 广告 点赞 评论 收藏 业务数据: 张表 用户 支付 订单表 订单详情 商品表 商品一二三级分类 二 DWD层 ETL对数据的核心字段进行清洗 去重 去空 ETL工具是什 ...
2021-12-16 17:17 0 1321 推荐指数:
ads层数据往往是最终的结果指标数据,在大屏展示,或者实时流处理时候使用,通过下面两个例子来练习业务大屏展示sql该怎么写。 1.会员分析案例 1.1 数据准备 表结构如下,其中此表是dws层以天为维度的会员表,比如每天的会员信息汇总, 1.2 会员指标计算 沉默会员的定义:只在安装 ...
1、数据仓库 我们常提的数仓(DataWarehouse),就是在我们已有的数据库(他是对数据的存储)的基础之上,增加了对数据的OLAP(On-Line Analytical Processing),支持复杂的数据分析操作,更侧重决策支持,提供直观易懂的查询结果,而数据库更着重的是事务处理 ...
第一章 ADS 聚合层 ads层,主要是根据各种报表及可视化来生成统计数据。通常这些报表及可视化都是基于某些维度的汇总统计。 1 需求 热门商品统计(作业) 热门品类统计(作业) 热门品牌统计 交易用户性别对比(作业) 交易用户年龄段对比(作业) 交易额省市 ...
数仓分层 ODS:Operation Data Store原始数据 DWD(数据清洗/DWI) data warehouse detail数据明细详情,去除空值,脏数据,超过极限范围的明细解析具体表 DWS(宽表-用户行为,轻度聚合) data warehouse service ...
简书上一篇博文讲数仓,我觉得和之前转的一篇帆软的博文也是挺有参考和学习价值的。讲清楚了每个分层的概念和做什么。 这是博文的出处https://www.jianshu.com/p/1dd894e5bb62 --------------------------------------------------------------------------------------------- ...
业务数仓的DWD层一般有两个典型操作: ①因为是DWD层,所以要进行数据清洗。 ②因为数据来源于web项目的数据库,标的设计遵循三范式,因此在数仓里需要进行降维,以减少join次数。 在示例的8张表中,订单表,订单详情表,用户表,支付流水表字段与ODS层一致。对商品表的分类进行降维。增加二级 ...
ODS层数据不做任何处理,完全仿照业务数据库中的表字段,一模一样的创建ODS层对应表。 8张表建表语句: ①用sqoop把导入到HDFS的时候,加了参数--fields-terminated-by "\t",因此这里ODS层建表的时候也注意相同的分隔符。 ②不管是全量导入还是其他形式,都使 ...
一、数仓为什么分层、怎么分层 1、数仓的作用 2、数仓的架构 3、数据采集层 4、数据存储与分析 对于hive的操作,最传统的方式是采用MapReduce 也可以通过SparkSQL操作hive 最常用的是使用Presto操作 ...