ads層數據往往是最終的結果指標數據,在大屏展示,或者實時流處理時候使用,通過下面兩個例子來練習業務大屏展示sql該怎么寫。 1.會員分析案例 1.1 數據准備 表結構如下,其中此表是dws層以天為維度的會員表,比如每天的會員信息匯總, 1.2 會員指標計算 沉默會員的定義:只在安裝 ...
一 ODS層 保持數據原貌,不做任何修改 數據壓縮:LZO壓縮,減少磁盤空間 創建的是分區表:可以防止后續的全表掃描 包括 用戶行為:string line dt ods start ods event 商品列表 商品詳情 點擊 廣告 點贊 評論 收藏 業務數據: 張表 用戶 支付 訂單表 訂單詳情 商品表 商品一二三級分類 二 DWD層 ETL對數據的核心字段進行清洗 去重 去空 ETL工具是什 ...
2021-12-16 17:17 0 1321 推薦指數:
ads層數據往往是最終的結果指標數據,在大屏展示,或者實時流處理時候使用,通過下面兩個例子來練習業務大屏展示sql該怎么寫。 1.會員分析案例 1.1 數據准備 表結構如下,其中此表是dws層以天為維度的會員表,比如每天的會員信息匯總, 1.2 會員指標計算 沉默會員的定義:只在安裝 ...
1、數據倉庫 我們常提的數倉(DataWarehouse),就是在我們已有的數據庫(他是對數據的存儲)的基礎之上,增加了對數據的OLAP(On-Line Analytical Processing),支持復雜的數據分析操作,更側重決策支持,提供直觀易懂的查詢結果,而數據庫更着重的是事務處理 ...
第一章 ADS 聚合層 ads層,主要是根據各種報表及可視化來生成統計數據。通常這些報表及可視化都是基於某些維度的匯總統計。 1 需求 熱門商品統計(作業) 熱門品類統計(作業) 熱門品牌統計 交易用戶性別對比(作業) 交易用戶年齡段對比(作業) 交易額省市 ...
數倉分層 ODS:Operation Data Store原始數據 DWD(數據清洗/DWI) data warehouse detail數據明細詳情,去除空值,臟數據,超過極限范圍的明細解析具體表 DWS(寬表-用戶行為,輕度聚合) data warehouse service ...
簡書上一篇博文講數倉,我覺得和之前轉的一篇帆軟的博文也是挺有參考和學習價值的。講清楚了每個分層的概念和做什么。 這是博文的出處https://www.jianshu.com/p/1dd894e5bb62 --------------------------------------------------------------------------------------------- ...
業務數倉的DWD層一般有兩個典型操作: ①因為是DWD層,所以要進行數據清洗。 ②因為數據來源於web項目的數據庫,標的設計遵循三范式,因此在數倉里需要進行降維,以減少join次數。 在示例的8張表中,訂單表,訂單詳情表,用戶表,支付流水表字段與ODS層一致。對商品表的分類進行降維。增加二級 ...
ODS層數據不做任何處理,完全仿照業務數據庫中的表字段,一模一樣的創建ODS層對應表。 8張表建表語句: ①用sqoop把導入到HDFS的時候,加了參數--fields-terminated-by "\t",因此這里ODS層建表的時候也注意相同的分隔符。 ②不管是全量導入還是其他形式,都使 ...
一、數倉為什么分層、怎么分層 1、數倉的作用 2、數倉的架構 3、數據采集層 4、數據存儲與分析 對於hive的操作,最傳統的方式是采用MapReduce 也可以通過SparkSQL操作hive 最常用的是使用Presto操作 ...