SSAS是用於SQL Server 2008 數據庫用於BI的組件,通過SSAS可以創建多維數據庫,並在之上進行數據挖掘操作。本文我們主要介紹一些關於SSAS數據分析的知識……
SSAS是用於SQL Server 2008 數據庫用於BI的組件,通過SSAS可以創建多維數據庫,並在之上進行數據挖掘操作。本文我們主要介紹一些關於SSAS數據分析的知識。接下來就讓我們來一起了解一下吧。
商業智能提供的解決方案能夠從多種數據源獲取數據並且能夠把各種數據轉化成同一格式數據進行存儲,最終達到讓用戶可以快速訪問解讀數據,為用戶分析和制定決定提供有效的數據支持。可以人為的把商業智能分為以下幾層:
數據源層:公司日常工作中會存在多種格式的數據,如文本文檔,excel文件,access數據庫文件,SQL Server數據庫文件等。
數據轉換層:由於數據源存在多樣化,為了方便分析,需要對它們進行一定的加工,使其數據格式相同,最終存入數據存儲系統。
數據存取層:關系數據庫管理系統(RDBMS)中創建數據倉庫,保存數據。
數據分析層:多維聯機分析處理數據庫做為數據分析層,負責把數據轉換成信息。
數據表示層:表示層的應用程序可以直接訪問數據倉庫或多維聯機分析處理數據庫等,可以用不同風格(表格、圖形等)展示數據的魅力。可以用EXCEL來秀數據,也可以用adomd.net開發asp.net(winform)等來秀數據,總之,熟悉后,可以根據實際需求想怎么秀就怎么秀。
度量值
在商業智能中,用來監控公司運行的可概括的數值被稱作度量值(measure)。如“SalesAmount”、“OrderQuantity”都被稱作度量值。如圖
“SalesAmount”標簽被稱為元數據,“100”為銷售數量。如果沒有“SalesAmount”這個元數據,“100”將只是一個數值而且這個數值將顯得毫無意義。
屬性
看下面一張產品屬性表,
“產品”、“模型”、“顏色”、“尺寸”被稱為屬性,而“Mountain-500”、“Road-750”、“Hitch Rack”被稱為屬性“模型”的成員,同樣,“黑色”和“銀色”也是“顏色”屬性的成員。“產品”屬性被稱為關鍵屬性,因為它可以唯一地確定其他屬性(顏色,尺寸等),在上表“產品“屬性列中也是唯一的,不存在重復值。如“Mountain-500 Black,40“就可以准確的定位到上表第一行,但是”模型“屬性成員”Mountain-500“在上表中不能確定具體是哪個產品。
看下面這個銷售報表,
這份報表中每種模型都有該模型下的相關產品銷售額的總和或者叫聚合(aggregation)。“模型“屬性和”產品“屬性以層次結構(hierarchy)進行組織,“模型”屬性的成員作為層次結構高層,“產品”屬性的成員作為底層。有了層次結構,我們可以選擇查看模型級的銷售額或者產品級的銷售額。
維度
相同的產品可以在兩個不同的州銷售,所以可以得到如下報表
這份報表有兩個“州”屬性成員,三個“模型”屬性成員,五個“月份”屬性層次結構構成的成員。所有值的最大可能數為:州數目*模型數目*月份數目=2*3*5=30。
報表中獨立屬性和層次結構稱作報表的維度,維度(dimension)包括屬性和層次結構。如上圖報表,州屬性屬於地理維度,模型屬性屬於產品維度,月屬性層次結構屬於日期維度。一個維度可能不止一個屬性,但每個維度只有一個關鍵屬性。其他與關鍵屬性相關的屬性都屬於同一維度。由於屬性屬於維度,那么屬性成員也即維度成員。維度中可以包含層次結構,用於創建層次結構的屬性必須屬於同一維度,同時該層次結構也屬於該維度。如,模型和產品構成的層次結構由產品維度中的屬性組成,而該層次結構也屬於產品維度。維度是相關屬性和層次結構進行分組的有效方法。
事實表和維度表
在維度數據倉庫中,維度存儲在維度表中,度量值被稱作事實並存儲於事實表中。事實表是存儲度量值的詳細值或事實的表。如圖,
這個事實表中,前三列(州鍵、產品鍵、月份鍵)是鍵列。鍵列的值將事實表每行中的事實和每個維度表中的一行聯系起來。剩下的兩列(銷售量和銷售額)包含了數值事實,是這張事實表的兩個度量值。和事實表相關的維度被稱作事實表的維數(dimensionality)。
許多維度屬性可用來對維度記錄進行分組,並可以對每組相關的事實表中的度量值進行匯總。
如上圖Product維度表中的記錄可被分為自行車和配件兩類,每種分組的銷售量都能計算出來。可以創建分組的屬性是可聚合的,如類別屬性、顏色屬性等,不可聚合的屬性稱為成員屬性,如價格,因為根據價格分組出來的數據沒什么太大的意義 。
度量值組
事實表中包含數據的列對應於維度模型中的度量值,因此,每張事實表都包含一組度量值。
分析服務用一組稱作度量值組的邏輯結構組織信息,度量值組與單個事實表及其相關的維度相對應。度量值組不但包含了每個維度的列以及每個度量值的列而且還包含了每個維度中的成員的每個可能的組合所對應的行。與事實表不同的是,事實表只包含單個細節的數據,而度量值組不但包含單個細節的數據,而且還包含更高級細節的聚合數據。如圖
上表中只有最后一行和事實表中的某行對應,該行包含了和事實表相同級的詳細信息。其他行都不會出現在事實表中,每行中都至少有一個維度層次結構中更高級別的成員。在具有更高級別成員的每一行中,通過累加低級細節數據使事實數據被聚合。上表只是列出了很小一部分的可能值。