數據分析模型

本文轉載自查看原文 2022-05-06 14:54 3200 可視化入門

數據分析模型組成

《Visualization Analysis & Design》這本書中提到的數據分析模型，這個模型分為三個部分：認識數據、確定任務和設計方案。

認識數據：What

認識數據的核心就是確定數據的類型，只有正確地認識數據類型才能選擇正確的可視化方法。總的來說數據分為三個層次：數據集、數據和屬性，這里需要說明一下層次中的數據和前面提到的數據是不一樣的：前面是一個統稱，這里的是具體的實例。數據是由一些數據集（DataSet）構成的，數據集又是由一條條數（Data）構成的，每一條數據是由屬性（Attribute）構成的。接下來我們就分別看看它們對應的類型。

數據集類型

數據集主要分為：表格（Table）、網絡（Network）和幾何（Geometry）。

表格是由行（Row）和列（Col）構成。對於一個一維表格（Flat Table）來說，每一行是一個實體（ Item ），每一列是該實體的一個屬性（Attribute ）。

網絡數據主要用來表示實體之間的關系，在網絡中的實體往往被稱作為節點（ node ），節點之間的關系被稱作為鏈接（link）。

位置（Position）去描述一個實體的形狀，這些實體可能是點，線，平面等。

數據類型

數據的主要種類是：實體（ Item ）、鏈接（Link）、位置（Position）和屬性（Attribute）。

實體是一個單獨的個體，比如表格中的一行，網絡中一個節點。可以是一個人，也可以是一只螞蟻。

鏈接是實體之間的關系（Relationship）。

位置是空間數據，描述二維或者三維空間的一個位置。

屬性是一個可以被測量、觀察和記錄的特性，所有的實體、鏈接和位置都由屬性構成。屬性又被稱為變量（Variable）或者數據維度（Data Dimension）。

確定任務：Why

我們需要一些確定的詞去描述任務，去將這些任務一步步抽象，變成和領域知識沒有關系的描述。這些詞可以分成兩個部分：行動（Action）和目標（Target）。

行動：Action

行動是動詞，主要用來描述用戶想要通過可視化達到的目的。這里主要介紹最常見的兩種行動：發現（Discover）和展現（Present）。

目標：Target

目標是動詞，是用戶對數據感興趣的方面，對於不同的數據類型可能會有不同的目標。

設計方案：How

在設計一個可視化的時候，我們主要有多種基本手段比如：分面（Facet），操作（Manipulate）和減少（Reduce），但是這里主要介紹編碼（Encode）這種方式。上一章節里面提到：“數據可視化將不可見或難以直接顯示的數據轉化為可感知的圖形、符號、顏色、紋理等”，這個從數據到視覺元素的過程就是編碼。
編碼過程主要有兩個部分：布局（Arrange）和映射（Map）。布局的主要任務就是確定視覺元素在最后畫布上的位置，映射的主要任務就是用視覺元素的屬性去表示數據的屬性。比如在條形圖中，我們需要根據數據種類確定每一個條的位置，這就是布局，也需要去確定數據的大小卻確定每一個條的高度，這就是映射。

小結

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 常用數據分析模型常見的數據分析模型數據分析常用的八個分析模型九種常見的數據分析模型八大常用數據分析模型電商數據分析模型九種常見的數據分析模型八大常用數據分析模型之熱力圖分析模型大數據分析中，有哪些常見的大數據分析模型？數據分析常用的經典模型-PEST分析模型