ODS(Operational Data Store):原始數據層,存放原始數據,直接加載原始日志、數據,數據保持原貌不做處理。 在ODS一般需要2個重要的步驟,示例如下: 1.建立ODS層的Hive表。 重要說明: ①ODS層存放的是原始數據,因此只需要一個字段就行 ...
DWD Data Warehouse Detail :數據明細層,結構和粒度與原始表保持一致,對ODS層數據進行清洗 取出空值 臟數據 超過極限范圍的數據 。 DWD層的數據來源於ODS原始數據層,在原始數據層的Hive表里,只有一個字段,存儲了原始的一條條日志信息,下面以事件 如商品點擊事件,展示詳情事件 日志來說明,原始日志如下: 數據格式為服務器時間 事件json,json中又包括公共字段c ...
2020-06-25 23:35 0 1233 推薦指數:
ODS(Operational Data Store):原始數據層,存放原始數據,直接加載原始日志、數據,數據保持原貌不做處理。 在ODS一般需要2個重要的步驟,示例如下: 1.建立ODS層的Hive表。 重要說明: ①ODS層存放的是原始數據,因此只需要一個字段就行 ...
業務數倉的DWD層一般有兩個典型操作: ①因為是DWD層,所以要進行數據清洗。 ②因為數據來源於web項目的數據庫,標的設計遵循三范式,因此在數倉里需要進行降維,以減少join次數。 在示例的8張表中,訂單表,訂單詳情表,用戶表,支付流水表字段與ODS層一致。對商品表的分類進行降維。增加二級 ...
ODS層數據不做任何處理,完全仿照業務數據庫中的表字段,一模一樣的創建ODS層對應表。 8張表建表語句: ①用sqoop把導入到HDFS的時候,加了參數--fields-terminated-by "\t",因此這里ODS層建表的時候也注意相同的分隔符。 ②不管是全量導入還是其他形式,都使 ...
為什么需要用戶行為寬表?把每個用戶單日的行為聚合起來組成一張多列寬表,以便之后關聯用戶維度信息后,進行不同角度的統計分析。 數據來源:DWD層相關的業務數據表 創建用戶行為寬表: 這張寬表整合了下單、支付和評論3種行為。 數據導入腳本: with as基本語法為如下,作用 ...
本文原鏈接:什么是數據倉庫,數倉有什么特點 數據倉庫,簡稱數倉,英文名稱為Data Warehouse,可簡寫為DW或DWH。數據倉庫,是為企業所有級別的決策制定過程,提供所有類型數據支持的戰略集合。它是單個數據存儲,出於分析性報告和決策支持目的而創建。 為需要業務智能的企業,提供指導 ...
目前主流的數據倉庫分層大多為四層,也有五層的架構,這里介紹基本的四層架構。 分別為數據貼源層(ods)、數據倉庫明細層(dw)、多維明細層(dws)和數據集市層(dm)。 下面是架構圖: 數據分層的目的是:減少重復計算,避免煙囪式開發,節省計算資源,靠上層次,越對應 ...
一、ODS層 1、保持數據原貌,不做任何修改 2、數據壓縮:LZO壓縮,減少磁盤空間 3、創建的是分區表:可以防止后續的全表掃描 包括 用戶行為:string line dt ods_start; ods_event(商品列表、商品詳情 ...
數據倉庫分層DWD、DWB、DWS DW :data warehouse 翻譯成數據倉庫DW數據分層,由下到上為 DWD,DWB,DWSDWD:data warehouse detail 細節數據層,有的也稱為 ODS層,是業務層與數據倉庫的隔離層DWB:data warehouse base ...