updated 2015.8.27 updated 2015.8.26 updated 2015.8.23 0. 说明 《数据仓库原理》系列博文,是笔者在学习数据仓库与商业智能时的读书笔记,现重新梳理思路,分享在这里,希望读者批评指正。 本系列主要包括以下几部 ...
第一章简介 数据仓库诞生背景 数据仓库概述 MPP amp 分布式架构 数据仓库技术实现 常见数据仓库产品 第二章架构 数据仓库架构设计 ETL流程 数据积存功能之ODS层 数据分析功能之DWD DWS ADS层 第三章建模 不同系统的建模方法 ROLAP维度模型 MOLAP建模方法 多维分析 第四章最佳实践 表的分类 ETL同步策略 任务调度 第五章项目实战 项目 amp 数据概述 架构设计 a ...
2020-10-11 11:00 1 1362 推荐指数:
updated 2015.8.27 updated 2015.8.26 updated 2015.8.23 0. 说明 《数据仓库原理》系列博文,是笔者在学习数据仓库与商业智能时的读书笔记,现重新梳理思路,分享在这里,希望读者批评指正。 本系列主要包括以下几部 ...
1. 引言 本篇主要讲述操作数据存储(ODS)系统产生的背景、定义、特点,以及它与数据仓库的区别。 在前两篇,笔者介绍了什么是数据仓库?为什么需要数据仓库?数据仓库系统的体系结构是什么?因此可能在读者心里已经形成了企业数据存储的DB~DW两层体系结构的概念,但在实际应用中,并不总是 ...
本期内容主要介绍使用Hive作为数据仓库的应用场景时,相应的库表结构如何设计。 Hive数据仓库 建立用户画像首先需要建立数据仓库,用于存储用户标签数据。Hive是基于Hadoop的数据仓库工具,依赖于HDFS存储数据,提供的SQL语言可以查询存储在HDFS中的数据。开发时一般使用Hive ...
总结1)数仓概念总结【1】数据仓库的输入数据源和输出系统分别是什么?输入系统:埋点产生的用户行为数据、JavaEE 后台产生的业务数据输出系统:报表系统、用户画像系统、推荐系统2)项目需求及架构总结【1】集群规模计算【2】框架版本选型1)Apache:运维麻烦,组件间兼容性需要自己调研。(一般大厂 ...
一、电商业务简介1.1 电商业务流程1.2 电商常识(SKU、SPU)SKU=Stock Keeping Unit(库存量基本单位)。现在已经被引申为产品统一编号的简称,每种产品均对应有唯一的 SKU ...
第一章、hive入门 一、hive入门手册 1.什么是数据仓库 1.1数据仓库概念 对历史数据变化的统计,从而支撑企业的决策。比如:某个商品最近一个月的销量,预判下个月应该销售多少,从而补充多少货源。 1.2传统数据仓库面临的挑战 (1)无法满足快速增长的海量数据存储需求 (2)无法有效 ...
1、OLTP和OLAP OLTP的全称是 Online Transaction Processing, OLTP主要用传统的关系型数据库来进行事务处理。OLTP最核心的需求是单条记录的高效快速处理,索引技术、 分库分表等最根本的诉求就是解决此问题 ...
## 1. 引言 `本篇主要讲述数据仓库系统的体系结构与组成要素、数据集市与数据仓库之间的关系、元数据的定义与作用。` 在[上一篇](http://www.cnblogs.com/hbsygfz/p/4752418.html),笔者介绍了数据仓库的定义: > “数据仓库是一个面向 ...