一、度量、指標、指標器 度量和維度構成OLAP的主要概念,對於在事實表或者一個多維立方體里面存放的數值型的、連續的字段,就是度量。這符合上面的意思,有標准,一個度量字段肯定是統一單位,例如元、戶數。如果一個度量字段,其中的度量值可能是歐元又有可能是美元,那這個度量沒法匯總。 在OLAP中 ...
下面內容摘自互聯網並作了整理。 名詞: BI Business Intelligence :商業智能, DW Data Warehouse :數據倉庫,詳見正文Q 部分。 OLTP On Line Transaction Processing :聯機事務處理 也稱為面向交易的處理系統,其基本特征是顧客的原始數據能夠馬上傳送到計算中心進行處理,並在非常短的時間內給出處理結果。這樣做的最大長處是能夠 ...
2014-11-06 19:35 0 5889 推薦指數:
一、度量、指標、指標器 度量和維度構成OLAP的主要概念,對於在事實表或者一個多維立方體里面存放的數值型的、連續的字段,就是度量。這符合上面的意思,有標准,一個度量字段肯定是統一單位,例如元、戶數。如果一個度量字段,其中的度量值可能是歐元又有可能是美元,那這個度量沒法匯總。 在OLAP中 ...
許多商業企業運營中的大量數據,通常稱為購物籃事務(market basket transaction)。表中每一行對應一個事務,包含一個唯一標識TID。 利用關聯分析的方法可以發現聯系如關聯規則或頻繁項集。 關聯分析需要處理的關鍵問題: 從大型事務數據集中發現模式可能在計算上要付出很高 ...
問題:數據總量爆炸式增加,如何從中提取真正有價值的信息,產生了新的領域(DM)。幾個名詞: 1)Data Mining:數據挖掘 2)Knowledge Discovery:知識發現 3)Machine Learning:機器學習(機器學習是數據挖掘的一個重要工具 ...
一.基本概念 我們來看上面的事務庫,如同上表所示的二維數據集就是一個購物籃事務庫。該事物庫記錄的是顧客購買商品的行為。這里的TID表示一次購買行為的編號,items表示顧客購買了哪些商品。 事務: 事務庫中的每一條記錄被稱為一筆事務。在上表的購物籃事務中,每一筆事務都表示一次 ...
沒有系統學過數學優化,但是機器學習中又常用到這些工具和技巧,機器學習中最常見的優化當屬凸優化了,這些可以參考Ng的教學資料:http://cs229.stanford.edu/section/cs229-cvxopt.pdf,從中我們可以大致了解到一些凸優化的概念,比如凸集,凸函數,凸 ...
Preface:本文將會講述 BI/DW/DA 領域的一些常見概念,如:事實表、維度表、建模、多維分析、cube 等,但不涉及具體實例分析。 1、維(Dimension) 維是用於從不同角度描述事物特征的,一般維都會有多層(Level:級別),每個Level都會包含一些共有的或特有的屬性 ...
1. 數據倉庫 數據倉庫一詞尚沒有一個統一的定義,著名的數據倉庫專家W. H. Inmon 在其著作《Buildingthe Data Warehouse》一書中給予如下描述:數據倉庫(Data Warehouse) 是一個面向主題的(Subject Oriented) 、集成 ...
數倉是一個面向主題的、集成的、穩定的、時變的,存儲歷史數據的倉庫。 面向主題的:數倉中的數據按照主題進行存儲,每個主題都是決策層分析的一個角度; 集成的:不同來源的數據會統一整合后存入數倉中; 穩定的:數據一旦進入倉庫后不會輕易發生改變,就算數據本身需要變化也輕易不會改動原數據,會根據分析 ...