花费 7 ms
数仓1.2 |分层| ODS& DWD& DWS& ADS| 行为数仓

数仓分层 ODS:Operation Data Store原始数据 DWD(数据清洗/DWI) data warehouse detail数据明细详情,去除空值,脏数据,超过极限范围的明细解析具体 ...

Sun Mar 24 18:14:00 CST 2019 0 21861
什么是星型模型和雪花型模型,以及区别

一、概述 在多维分析的商业智能解决方案中,根据事实表和维度表的关系,又可将常见的模型分为星型模型和雪花型模型。在设计逻辑型数据的模型的时候,就应考虑数据是按照星型模型还是雪花型模型进行组织。 当所 ...

Sun May 16 05:02:00 CST 2021 0 8578
最强最全面的数仓建设规范指南

本文将全面讲解数仓建设规范,从数据模型规范,到数仓公共规范,数仓各层规范,最后到数仓命名规范,包括表命名,指标字段命名规范等! 目录: 一、数据模型架构原则 ...

Thu Nov 11 20:22:00 CST 2021 1 5853
Hive如何根据表中某个字段动态分区

使用hive储存数据时,需要对做分区,如果从kafka接收数据,将每天的数据保存一个分区(按天分区),保存分区时需要根据某个字段做动态分区,而不是傻傻的将数据写到某一个临时目录最后倒入到某一个分区,这 ...

Mon Nov 12 23:34:00 CST 2018 3 4477
使用hive增量更新

目录 1、增量更新 2、对第一种情况 2.1、准备工作 2.2、更新数据 3、对第二种情况 3.1、准备工作 3 ...

Tue Feb 23 01:16:00 CST 2021 0 1575
指标管理系统设计

什么是指标 数据团队出具的一个统计报表字段即为指标。比如最近七天的订单量,一个促销活动的购买转化率等等。 一个指标具体到计算实施,主要有以下几部分组成 指标加工逻辑,比如count ,sum ...

Thu Sep 10 02:49:00 CST 2020 0 2359
数仓建设中最常用模型--Kimball维度建模详解

数仓建模首推书籍《数据仓库工具箱:维度建模权威指南》,本篇文章参考此书而作。 文章首发公众号:五分钟学大数据,公众号中发送“维度建模”即可获取此书籍第三版电子书 先来介绍下此书,此书是基于 ...

Mon Jan 11 23:56:00 CST 2021 0 1472
Datastage 入门

前言 最近接触一个新项目,要用到datastage,翻了一下网上的中文资料很少,决定翻译一些官网资料在这里,方便自己学习回顾。 什么是Datastage? Datastage是一个 ...

Wed Mar 02 22:51:00 CST 2022 0 3064

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM