背書
隨着大數據的到來,經常聽到相關的詞匯,維度、指標、BI、PV、UV等等,今天整理了這些詞匯。
DW
DW是Data Warehouse的縮寫,即數據倉庫。
DW要區別於普通數據庫,數據倉庫用於支持決策,面向分析型數據處理;而普通數據庫主要服務於軟件/網站,對於一致性/事物要求較高。
BI
BI是Business Intelligence的英文縮寫,中文解釋為商務智能,用來幫助企業更好地利用數據提高決策質量的技術集合,是從大量的數據中鑽取信息與知識的過程。簡單講就是業務、數據、數據價值應用的過程。用圖解的方式可以理解為下圖:
指標
我的理解就是結果數字,比如pv、uv等,和維度對應
維度
我的理解維度就是指標的定語。比如:“2015-01-12的pv是1000”,那么日期(是2015-01-12的抽象)是維度,pv是指標,1000是值
維度表
維度表放的就是存放維度的數據表,或者維度關系的數據表
事實表
事實表里存放着要查詢維度的數據。比如:每天的pv、uv
ETL
是英文 Extract-Transform-Load 的縮寫,用來描述將數據從來源端經過萃取(extract)、轉置(transform)、加載(load)至目的端的過程。ETL是構建數據倉庫的重要一環,用戶從數據源抽取出所需的數據,經過數據清洗,最終按照預先定義好的數據倉庫模型,將數據加載到數據倉庫中去。
OLAP
OLAP是聯機分析處理(On-Line Analytical Processing)的縮寫。
百度解釋:OLAP是使分析人員、管理人員或執行人員能夠從多角度對信息進行快速、一致、交互地存取,從而獲得對數據的更深入了解的一類軟件技術。
翻譯成人話:把事實表和維度表里面的數據展示出來的過程。
關於數據倉庫分層的概念,可以參考:http://www.cnblogs.com/liqiu/p/4013743.html