數據分析模型組成
《Visualization Analysis & Design》這本書中提到的數據分析模型,這個模型分為三個部分:認識數據、確定任務和設計方案。
認識數據:What
認識數據的核心就是確定數據的類型,只有正確地認識數據類型才能選擇正確的可視化方法。總的來說數據分為三個層次:數據集、數據和屬性,這里需要說明一下層次中的數據和前面提到的數據是不一樣的:前面是一個統稱,這里的是具體的實例。數據是由一些數據集(DataSet) 構成的,數據集又是由一條條數(Data) 構成的,每一條數據是由屬性(Attribute) 構成的。接下來我們就分別看看它們對應的類型。
數據集類型
數據集主要分為:表格(Table) 、網絡(Network) 和幾何(Geometry) 。
- 表格是由行(Row)和列(Col)構成。對於一個一維表格(Flat Table)來說,每一行是一個實體( Item ) ,每一列是該實體的一個屬性(Attribute ) 。
- 網絡數據主要用來表示實體之間的關系,在網絡中的實體往往被稱作為節點( node ) ,節點之間的關系被稱作為鏈接(link) 。
- 位置(Position) 去描述一個實體的形狀,這些實體可能是點,線,平面等。
數據類型
數據的主要種類是:實體( Item ) 、鏈接(Link)、位置(Position) 和屬性(Attribute) 。
- 實體是一個單獨的個體,比如表格中的一行,網絡中一個節點。可以是一個人,也可以是一只螞蟻。
- 鏈接是實體之間的關系(Relationship)。
- 位置是空間數據,描述二維或者三維空間的一個位置。
- 屬性是一個可以被測量、觀察和記錄的特性,所有的實體、鏈接和位置都由屬性構成。屬性又被稱為變量(Variable) 或者數據維度(Data Dimension) 。
確定任務:Why
我們需要一些確定的詞去描述任務,去將這些任務一步步抽象,變成和領域知識沒有關系的描述。這些詞可以分成兩個部分:行動(Action) 和目標(Target) 。
行動:Action
行動是動詞,主要用來描述用戶想要通過可視化達到的目的。這里主要介紹最常見的兩種行動:發現(Discover)和展現(Present)。
目標:Target
目標是動詞,是用戶對數據感興趣的方面,對於不同的數據類型可能會有不同的目標。
設計方案:How
在設計一個可視化的時候,我們主要有多種基本手段比如:分面(Facet) ,操作(Manipulate) 和減少(Reduce) ,但是這里主要介紹編碼(Encode) 這種方式。上一章節里面提到:“數據可視化將不可見或難以直接顯示的數據轉化為可感知的圖形、符號、顏色、紋理等”,這個從數據到視覺元素的過程就是編碼。
編碼過程主要有兩個部分:布局(Arrange) 和映射(Map) 。布局的主要任務就是確定視覺元素在最后畫布上的位置,映射的主要任務就是用視覺元素的屬性去表示數據的屬性。比如在條形圖中,我們需要根據數據種類確定每一個條的位置,這就是布局,也需要去確定數據的大小卻確定每一個條的高度,這就是映射。