原文:數倉1.3 |行為數據| 業務數據需求

只要是insert into 的就是沒分區 需求一:用戶活躍主題 DWS層 用戶行為寬表層 目標:統計當日 當周 當月活動的每個設備明細 每日活躍設備明細dwd start log gt dws uv detail day 把相同的字段collect set到一個數組, 按mid id分組 便於后邊統計 collect set將某字段的值進行去重匯總,產生array類型字段。如: concat w ...

2019-03-20 22:31 1 1681 推薦指數:

查看詳情

電子商務大數據平台實訓用戶行為業務總結

1 用戶行為業務總結 1.1 分幾層?每層做什么的? 1)ODS層(原始數據層) 存儲原始數據,直接加載原始日志、數據數據保持原貌不做處理。 2)DWD層(明細層) 對ODS層數據進行清洗(去除空值、臟數據,超過極限范圍的數據) 3)DWS層(服務數據層) 以DWD層為基礎 ...

Tue Sep 21 03:46:00 CST 2021 0 104
數據倉庫 業務 ODS層

ODS層數據不做任何處理,完全仿照業務數據庫中的表字段,一模一樣的創建ODS層對應表。 8張表建表語句: ①用sqoop把導入到HDFS的時候,加了參數--fields-terminated-by "\t",因此這里ODS層建表的時候也注意相同的分隔符。 ②不管是全量導入還是其他形式,都使 ...

Thu Jul 02 06:38:00 CST 2020 0 633
數據倉庫 業務 DWD層

業務的DWD層一般有兩個典型操作: ①因為是DWD層,所以要進行數據清洗。 ②因為數據來源於web項目的數據庫,標的設計遵循三范式,因此在數里需要進行降維,以減少join次數。 在示例的8張表中,訂單表,訂單詳情表,用戶表,支付流水表字段與ODS層一致。對商品表的分類進行降維。增加二級 ...

Thu Jul 02 07:04:00 CST 2020 0 1569
數據倉庫 用戶行為 DWD數據明細層操作示例

DWD(Data Warehouse Detail):數據明細層,結構和粒度與原始表保持一致,對ODS層數據進行清洗(取出空值、臟數據、超過極限范圍的數據)。 DWD層的數據來源於ODS原始數據層,在原始數據層的Hive表里,只有一個字段,存儲了原始的一條條日志信息,下面以事件(如商品點擊事件 ...

Fri Jun 26 07:35:00 CST 2020 0 1233
數據倉庫 用戶行為 ODS原始數據層操作示例

ODS(Operational Data Store):原始數據層,存放原始數據,直接加載原始日志、數據數據保持原貌不做處理。 在ODS一般需要2個重要的步驟,示例如下: 1.建立ODS層的Hive表。 重要說明: ①ODS層存放的是原始數據,因此只需要一個字段就行 ...

Thu Jun 25 21:20:00 CST 2020 0 1382
數據項目實戰之在線教育(01需求

第1章 數據倉庫概念 數據倉庫是為企業所有級別的決策制定過程,提供所有類型數據支持的戰略集合。 數據倉庫是出於分析報告和決策支持目的而創建的,為需要業務智能的企業,提供指導業務流程改進、監控時間、成本、質量以及控制。 第2章 項目需求及架構設計 2.1 項目需求 ...

Thu Nov 12 23:32:00 CST 2020 0 595
【大數據】什么是

我有自己的博客啦,歡迎各位客官前來哦!戳我進入! 什么是 一、是什么 ,全稱就是數據倉庫,是一個面向主題,集成的,相對穩定的,反映歷史變化的數據集合,通常用於支持管理決策。這里的主題指的是為了分析數據而創造產生的各種有助於決策的數據模型。 隨着互聯網的發展,數據 ...

Sat Nov 14 04:29:00 CST 2020 0 5477
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM