一、數倉分層1.1 為什么要分層1.2 數據集市與數據倉庫概念1.3 數倉命名規范1.3.1 表命名 ODS層命名為ods_表名 DWD層命名為dwd_dim/fact_表名 DWS層命名為dws_表名 DWT層命名為dwt_購物車 ADS層命名為ads_表名 臨時表 ...
一 數倉搭建 DWS 層 . 業務術語 用戶用戶以設備為判斷標准,在移動統計中,每個獨立設備認為是一個獨立用戶。Android系統根據 IMEI 號,IOS 系統根據 OpenUDID 來標識一個獨立用戶,每部手機一個用戶 新增用戶首次聯網使用應用的用戶。如果一個用戶首次打開某 APP,那這個用戶定義為新增用戶 卸載再安裝的設備,不會被算作一次新增。新增用戶包括日新增用戶 周新增用戶 月新增用戶 ...
2020-09-27 13:35 0 443 推薦指數:
一、數倉分層1.1 為什么要分層1.2 數據集市與數據倉庫概念1.3 數倉命名規范1.3.1 表命名 ODS層命名為ods_表名 DWD層命名為dwd_dim/fact_表名 DWS層命名為dws_表名 DWT層命名為dwt_購物車 ADS層命名為ads_表名 臨時表 ...
一、ODS層 1、保持數據原貌,不做任何修改 2、數據壓縮:LZO壓縮,減少磁盤空間 3、創建的是分區表:可以防止后續的全表掃描 包括 用戶行為:string line dt ods_start; ods_event(商品列表、商品詳情 ...
1、數據倉庫 我們常提的數倉(DataWarehouse),就是在我們已有的數據庫(他是對數據的存儲)的基礎之上,增加了對數據的OLAP(On-Line Analytical Processing),支持復雜的數據分析操作,更側重決策支持,提供直觀易懂的查詢結果,而數據庫更着重的是事務處理 ...
Table/SQL 的 blink planner 成為默認 Planner。 Flink 1.11 中流計算結合 Hive 批處理數倉,給離線數倉帶來 Flink 流處理實時且 Exactly-once 的能力。另外,Flink 1.11 完善了 Flink 自身的 Filesystem ...
項目背景及需求說明 這是一個數據管理"工具類"的系統,計划有三個核心功能: 1、通過界面配置相關連接字符串,查詢數據庫的表數據。 2、配置相關模板,生成數據庫表。 可以界面填報或通過Excel導入導出填報表數據。 3、通過界面配置導出數據庫表結構(數據字典 ...
本次課程就正式進入開發部分。 首先我們先搭建項目框架,還是和之前漸進式風格保持一致,除必備組件外,盡量使用原生功能以方便大家理解。 開發工具:vs 2019 或以上 數據庫:SQL SERVER 2017 或以上 其他需要用到的我們在項目過程中再提。 一、新建 ...
基於Spark快速構建數倉項目 目錄 基於Spark快速構建數倉項目 重點問題 什么是數據倉庫 基於Spark集成數據源(ETL) 基於Spark SQL 進行OLAP分析 QA 重點問題 數據倉庫解決 ...
一、用戶行為數倉. 1、數倉分層架構圖 2、埋點行為數據基本格式(基本字段) 3、項目經驗總結 MySQL的高可用 存儲元數據,搭建時要進行高可用HA 4、日期函數 1)date_add、date_sub函數(加減日期)2)next_day函數(周指標相關 ...