數據分析模型


數據分析模型組成

《Visualization Analysis & Design》這本書中提到的數據分析模型,這個模型分為三個部分:認識數據、確定任務和設計方案。

認識數據:What

認識數據的核心就是確定數據的類型,只有正確地認識數據類型才能選擇正確的可視化方法。總的來說數據分為三個層次:數據集、數據和屬性,這里需要說明一下層次中的數據和前面提到的數據是不一樣的:前面是一個統稱,這里的是具體的實例。數據是由一些數據集(DataSet) 構成的,數據集又是由一條條數(Data) 構成的,每一條數據是由屬性(Attribute) 構成的。接下來我們就分別看看它們對應的類型。

數據集類型

數據集主要分為:表格(Table) 、網絡(Network) 和幾何(Geometry) 。

  • 表格是由行(Row)和列(Col)構成。對於一個一維表格(Flat Table)來說,每一行是一個實體( Item ) ,每一列是該實體的一個屬性(Attribute ) 。
  • 網絡數據主要用來表示實體之間的關系,在網絡中的實體往往被稱作為節點( node ) ,節點之間的關系被稱作為鏈接(link) 。
  • 位置(Position) 去描述一個實體的形狀,這些實體可能是點,線,平面等。

數據類型

數據的主要種類是:實體( Item ) 、鏈接(Link)、位置(Position) 和屬性(Attribute) 。

  • 實體是一個單獨的個體,比如表格中的一行,網絡中一個節點。可以是一個人,也可以是一只螞蟻。
  • 鏈接是實體之間的關系(Relationship)。
  • 位置是空間數據,描述二維或者三維空間的一個位置。
  • 屬性是一個可以被測量、觀察和記錄的特性,所有的實體、鏈接和位置都由屬性構成。屬性又被稱為變量(Variable) 或者數據維度(Data Dimension) 。

確定任務:Why

我們需要一些確定的詞去描述任務,去將這些任務一步步抽象,變成和領域知識沒有關系的描述。這些詞可以分成兩個部分:行動(Action) 和目標(Target) 。

行動:Action

行動是動詞,主要用來描述用戶想要通過可視化達到的目的。這里主要介紹最常見的兩種行動:發現(Discover)和展現(Present)。

目標:Target

目標是動詞,是用戶對數據感興趣的方面,對於不同的數據類型可能會有不同的目標。

設計方案:How

在設計一個可視化的時候,我們主要有多種基本手段比如:分面(Facet) ,操作(Manipulate) 和減少(Reduce) ,但是這里主要介紹編碼(Encode) 這種方式。上一章節里面提到:“數據可視化將不可見或難以直接顯示的數據轉化為可感知的圖形、符號、顏色、紋理等”,這個從數據到視覺元素的過程就是編碼。
編碼過程主要有兩個部分:布局(Arrange) 和映射(Map) 。布局的主要任務就是確定視覺元素在最后畫布上的位置,映射的主要任務就是用視覺元素的屬性去表示數據的屬性。比如在條形圖中,我們需要根據數據種類確定每一個條的位置,這就是布局,也需要去確定數據的大小卻確定每一個條的高度,這就是映射。

小結


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM