大數據可視化知識點


        第一章

         可視化定義:   利用人眼的感知能力對數據進行交互的可視表達以增強認知的技術,稱為可視化。

  1. 數據可視化的主要作用包括數據記錄和表達數據操作數據分析三個方面,這也是可視化技術支持計算機輔助數據認知的三個基本階段。
  2. 可視化定義:   利用人眼的感知能力對數據進行交互的可視表達以增強認知的技術,稱為可視化。
  3. 據Ward m o(2010)的研究,超過(50%)的人腦功能用於視覺信息處理,視覺信息處理是人腦的最主要功能之一。
  4. 從宏觀角度看,數據可視化的功能不包括(C)

信息記錄 信息的推理分析 信息清洗 信息傳播

  1. 可視化的意義:
  • 真(真實性) 指是否正確地反映了數據的本質,以及對所反映的事物和規 律有無正確的感受和認識。
  • 善(傾向性) 是可視化所表達的意象對於社會和生活具有什么意義和影響。
  • 美(藝術完美型) 指其形式與內容是否和諧統一,是否有藝術個性,是否有創 新和發展。

        第二章

1. 數據:數據是符號的集合,是表達客觀事物的未經加工的原始素材。

數據模型:用來描述數據表達的底層描述模型,包含數據的定義和類型,以及不同類型數據的操作功能

概念模型:對目標事物的狀態和行為進行抽象的語義描述,並提供構建、推理支持等操作

2.數據分7類:一維 二維 三維 時間 多維 樹 網絡

3. 數據可視化流程:

問題刻畫層:概括現實生活中用戶遇到的問題

抽象層:抽象相應數據類型的操作

編碼層:設計編碼和交互方法

實現層:實現算法和交互

3數據可視化流程的核心要素:

• 數據表示與變換

• 數據的可視化呈現

• 用戶交互

以分為三類:

原始數據繪圖

  1. 折線圖
  2. 柱狀圖
  3. 直方圖
  4. 餅圖
  5. 等值線圖
  6. 走勢圖
  7. 散點圖
  8. 維恩圖
  9. 熱力圖

 簡單統計值標繪

多視圖協調關聯

4.等值線是制圖對象某一數量指標值相等的各點連成的平滑曲線,由地圖上標出的表示制圖數量的各點,采用內插法找出各整數點繪制而成的。

5.平行坐標系是一種多維數據可視化技術技術,使用平行的數值軸線來代表維度,通過在軸上刻畫多維數據的數值並用折線相連某一數據項在所有軸上的坐標點,從而在二維空間內施展多維數據。

可視分析流程圖的起點是數據表示與轉換,終點是分析推理

極坐標圖形是使用原點和相角來繪制的

數據可視化的三種類型:數據可視化 科學可視化 信息可視化  

        第三章

1.可視化是對數據的透徹理解、深入分析和綜合運用,主要包括數據采集、數據處理、數據處理可視化模式和可視化應用4個環節

2.人眼的視覺有惰性,這種惰性現象也稱為視覺暫留,視覺暫留時間約為0.05~0.2s

3.雷達圖適用於多維數據,且每個維度必須可以排序。

 

        第四章

1.層次數據主要表現為兩類:包含和從屬 邏輯上的承接關系

2.層次數據化主要類別:節點-鏈接 空間填充  混合型

①節點-鏈接(node-link):將單個個體繪制成一個節點,節點之間的連線表示個體之間 的層次關系

優點:直觀清晰,特別適合用於表示承接的層次關系

缺點:當個體數目太多,特別是廣度和深度相差較大的時候,節點-鏈接伐的可讀性較差,大量數據點聚集在屏幕局部范圍,難以高效的利用有限的屏幕空間

②空間填充(space-filling):用空間中的分塊區域表示數據中的個體,並用外層區域對內層區域的包圍表示彼此之間的層次關系

優點:具有高效的屏幕空間利用率,可以呈現更多的數據,更適合於顯示包含和從屬的關系

缺點:數據的層次關系表達不如節點-鏈接法清晰

3.網絡數據(network data):不具備層次結構的關系數據,可統稱為網絡數據

4. 文本可視化:采用可視表達技術,刻畫文本和文檔,直觀地呈現文檔中的 有效信息。用戶通過感知和辨析可視圖元提取信息

5.文本可視化的核心:如何輔助用戶准確無誤的從文本中提取並簡潔直觀地展示信息

6.文本信息的層級: • 詞匯級 • 語法級 • 語義級

7.文本可視化流程:原始文本 文本信息挖掘 視圖繪制 人機交互

8. 文本信息挖掘(包括三個方面):

文本數據的預處理

文本特征的抽取

文本特征的度量

9. 標簽雲(tag cloud,又名text cloud、word cloud)

直接抽取文本中的關鍵詞並將其按照一定順序、規律和約束整齊美觀地排列在屏幕上標簽雲利用顏色和字體大小或他們的組合來表示重要性,越是重要的詞匯,其字體越大,顏色越顯著,反之亦然

  1. 文本內容可視化:基於關鍵詞的文本內容可視化(標簽雲)、時 序性的文本內容可視化(主題河流)
  2. 情感分析:常被應用與論壇用戶發言、社交網絡、微博數據,以及各種調研報告等文本
  3. 文本特征: 分布模式可視化、文檔信息檢索可視化、軟件可視化
  4. 基於任務分類學的數據類型定義了7個基本任務,分別是:總覽 縮放 過濾 按需細化    關聯 歷史和提取
  5. 人流走勢代碼

 

 

        第五章

1.主動式交互(雙向交互):能達到人與人的交互的體驗

2.被動交互(單向交互):在用戶與系統/產品進行交互的操作過程中,用戶自身對於數 據建立的心智模型也在不斷地變化並改進,這種交互稱之為被動交互。

3.. 三種不同類別的交互操作的延時期望:

①感知處理(perceptual processing):指用戶感知交互效果的過程

②立即反應(immediate response):指用戶和可視化系統之間類似對話的交互,

③基本任務(unit task):指用戶在交互中指令系統完成一個相對復雜的任務。

3.(重點)交互技術:選擇 導航 重配 編碼 抽象/具象 過濾 關聯 概覽+細節 焦點+上下文

4.可視化工具 Echarts Tableau

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM