作為一個數據人,是不是經常被各種名詞圍繞,是不是對其中很多概念認知模糊。有些詞雖然只有一字之差,但是它們意思完全不同,今天我們就來了解下數倉建設及數據分析時常見的一些概念含義及它們之間的關系。 本文結構如下圖所示: 一、數倉中常見概念解析 1. 實體 ...
作為一個數據人,是不是經常被各種名詞圍繞,是不是對其中很多概念認知模糊。有些詞雖然只有一字之差,但是它們意思完全不同,今天我們就來了解下數倉建設及數據分析時常見的一些概念含義及它們之間的關系。 本文結構如下圖所示: 一 數倉中常見概念解析 . 實體 實體是指依附的主體,就是我們分析的一個對象,比如我們分析商品的銷售情況,如華為手機近半年的銷售量是多少,那華為手機就是一個實體 我們分析用戶的活躍度, ...
2021-09-09 13:49 0 471 推薦指數:
作為一個數據人,是不是經常被各種名詞圍繞,是不是對其中很多概念認知模糊。有些詞雖然只有一字之差,但是它們意思完全不同,今天我們就來了解下數倉建設及數據分析時常見的一些概念含義及它們之間的關系。 本文結構如下圖所示: 一、數倉中常見概念解析 1. 實體 ...
事實表:每個數據倉庫都包含一個或者多個事實數據表。事實數據表可能包含業務銷售數據,如銷售商品所產生的數據,與軟件中實際表概念一樣 維度:說明數據,維度是指可指定不同值的對象的描述性屬性或特征。例如,地理位置的維度可以包括“緯度”、“經度”或“城市名稱”。“城市名稱”維度的值 ...
在數據庫表設計中會糾結於”自然鍵”和”代理鍵”的選擇,自然鍵在實現數據“軟刪除”時實現比較復雜,部分自然鍵因為鍵值過長或多列組合導致不適合作為表主鍵,而比較常見兩種代理鍵為自增列(auto incremnet)和全局唯一標識列(GUID)。 使用自增列作為主鍵的優缺點: 使用 ...
1.什么是KPI? KPI:指的是關鍵績效指標,是Key Performance Indicator的縮寫。 KPI通常在企業管理中使用,表示一種指標,這種指標往往是部門主管要求完成、衡量員工業績的證明,是把企業的戰略目標分解為可操作的工作目標的工具,是企業績效管理的基礎。 2.什么是痛點 ...
建表SQL參考:(每個字典一個表,比如辦學類型一個表dim_bxlx,民族一個表dim_mz) ----更新 通常標准字典表中的字典名和原始表會有出入,例如標准字典為男女,原始 ...
什么是維度 維度是維度建模的基礎和靈魂。在維度建模中,將度量稱為“事實” ,將環境描述為“維度”,維度是用於分析事實所需要的多樣環境。 例如,在分析交易過程時,可以通過買家、賣家、商品和時間等維度描述交易發生的環境。 什么是維度屬性 維度所包含的表示維度的列,稱為維度屬性。維度 ...
數倉分層 1.ODS層 原始數據層,存放原始數據,直接加載原始日志、數據,數據保持原貌不做處理,起到備份數據的作用。數據采用LZO壓縮,並創建索引減少磁盤存儲空間(切片)。創建分區表,防止后續全表掃描。可以通過創建外部表供多人使用,內部表(僅供自己使用) 2.DWD層 明細數據層,對ODS層數 ...
數據模型是數據關系的一種映射,就是將業務之間的關系,用模型圖形化展示出來,在設計數據倉庫模型和架構的時候, ...