tableau基礎知識


tableau基礎知識

  • 篩選
  • 維度,度量
  • 跨數據源(把多個數據源放置到一個數據源)和混合數據源(多個不同的數據源進行關聯)
  • 格式--“標記”中的各類操作。
  • 分組和分層

 

 

Tableau在何處篩選?

有3個地方:

  • 摘要/聚合 篩選:
    • 比如使用sum函數對不同類別的產品利潤進行聚合計算。然后篩選出產品利潤>0的產品類別。
  • 記錄級別篩選
    • 針對每條記錄,設置一個條件。
  • 數據源篩選。
    • 比如,給某個部門的經理發送一個做好的展板。這個經理只能看他們部門的數據。

 

 

篩選器的使用順序:

  1. 數據提取篩選器 (點擊編輯)

  2. 數據源篩選器

    • 如果使用數據提取,那么它對提取的數據進行二次篩選

    • 如果使用實時, 那么對實時數據進行篩選。
  3. 上下文篩選器 (即鎖定篩選范圍,它之后的篩選器只會對它篩選出的結果做進一步篩選)(右鍵單擊篩選器膠囊,選擇“上下文篩選”)

  1. 維度篩選器,⚠️相同級別的篩選器,進行獨立篩選然后並Union.

  2. 度量篩選
  3. 表計算的過濾。

 

維度和度量(藍色和綠色)

系統會為每個字段自動分配一種數據類型(例如整數、字符串、日期)和一個角色:離散維度或連續度量(較常見),或者連續維度或離散度量(不太常見)。

 

度量名稱和度量值

  • 度量名稱:位於維度中,引用所有的度量值作為列名

  • 度量值:位於度量中,引用所有的度量值。

使用度量名稱/度量值的篩選器,選擇要顯示的度量值。

 

聚合, 粒度, 比率計算

粒度:視圖的細分程度。每個點都是一個細分粒度。

 

聚合操作

使用聚合函數進行計算。tableau的自動功能可更會造成錯誤,這是因為計算方式不一樣,所以要根據需求來判斷是否需要使用聚合函數。

 


 

 

跨數據庫操作,和混合操作

更新(4-20): 參考了一篇文章《如何合並數據》, 對tableau的數據整合有明晰的理解。

更新內容:

從SQL理解:數據表的合並就只有union和join。上下合並和左右相連。

tableau desktop提出的數據混合blend的概念,以及跨數據庫連接的概念,這兩個概念是基於它自身的概念。

借鑒一下圖:

先說跨數據庫連接,我的理解就是SQL的數據表的join。具體方式見👇。

 

至於為什么desktop要使用這個2個概念:

參考文章認為這2個概念代表了作圖的2大步驟:

我的圖是對原文圖的一種更新:

  1. 這張圖用來表示的是desktop提出的👆的2個概念的用在哪里。
    • 左圈:代表跨數據庫操作。
    • 右圈:代表blend數據混合操作。
    • ⚠️視圖是數據的直觀表現。
  2. desktop是作圖和展示工具。並沒有完善的數據整理清洗功能。如原文作者所講,數據並集操作歸類於數據整理。不屬於制作這張圖的目的。

 

使用數據混合 (使用不同的數據源:即新建數據源)

也可以用於連接,但固定使用左連接;數據混合只能是左聯接,這意味着主表應包含所有可能的值。

如果進行連接,左表就叫主表(用綠色勾表示),右表叫做輔助表(紅色勾表示)。

 

⚠️下圖,紅色標簽表示這個表是輔助表。

 

用“2016年產品”表中的“類別”和“2016年銷售額”的“銷售額”創建一個圖表,使用“2016年銷售額”的“市場”標記。

 因此這個例子不適合使用混合。

 

跨數據庫連接 (也叫集成數據源)

下圖👇把2個來源不同的數據庫,連接到tableau, 然后提取需要的數據表,使用inner join的方式進行表連接。

即:從不同數據庫選擇表進行mysql中的表連接操作。

我的理解:這兩個數據庫中的數據表,存放在tableau的一個數據源內。

 

 這樣創建的新表。就可以了。

 

但⚠️

  • 如果數據表關聯鍵具有一對一關系(也就是說,每個表的鏈接字段中的每個值只有一條記錄),則表聯接更適合。
  • 如果表具有一對多或多對多關系,這種方法會在聯接后創建重復的數據。 

 

使用混合還是連接表要考慮:

  1. 你的目的是什么
  2. 使用的數據表的特點。使用的主鍵的值是否具有唯一性。 

 

附加:

blend數據混合是desktop中的概念, Prep沒有這個概念!

 


 

格式

標簽的使用

即圖上的點的值的顯示方式。

 

 可以對圖上的點的標簽進行多種樣式,顯示方式的設置。

 

注釋

三種在圖上的注釋:

  • 點注釋:可以在圖上的任意位置添加。
  • 區域注釋:同上。
  • 標記:需要先選擇圖上的點。不能隨意移動,始終有一條線和選中的點相連。

 

 注釋也可以編輯(內容)和設置格式。

 

工具提示

超強的功能:

懸停鼠標在圖表上,顯示信息。

默認下,創建所圖表的所有字段的信息,都會加入到‘工具提示’中。 

優化做法,把所有字段,以一句話顯示:

  • 內<年(訂購日期)>年<季度(訂購日期)>,<類別>類銷售額為$<總和(銷售額)>,利潤為<總和(利潤)>

強化的功能:

  • 當彈出工具提示后,點擊圖上的點,可以臨時鎖定‘工具提示’,然后馬上在‘工具提示’上點擊字段,顯示對應的圖表。

 

 

 

 

強大的功能-加上語法判斷:

自定義的膠囊,包含着語法:if 

最后的效果:

總之:注釋,標簽,工具提示都是輔助看圖的工具。

 

格式設置

圖表上的任何元素都有相關的格式設置。

另外格式可以從一張圖表復制到另一張圖表。

 


 

 

分組和分層

都是tableau的概念,為了對數據進行方便的操作

分組:

假設一個表地區,有一個列“地區”:包括["東北", “西北”, “華南”,“華中”, “華東”,“西南”] 6個值:

 

 

中國北方地區和南方地區的經濟發達程度不同,我們想要以此分為兩個部分:['北方中國', ‘南方中國’]來進行經濟數據的比較分析。

所以,tableau使用分組操作達到這一目的。

右鍵點擊“維度”中的“地區”->在下拉菜單選擇"創建"->"組..."

 

 

 

分層

tableau官方說法是用於“下鑽”。其實就是SQL語法的group by的擴展。

⚠️圖標的樣子。

 

 

 

 對應SQL: 

select 國家,地區,城市, sum(銷售額) from 銷售表 group by 國家,地區,城市

 

國家,地區,城市是三個columns字段/列名。

 

 

taleau的擴展

tableau對分組的標簽也可以進行分組。

上面創建了一個分組“地區(組)”,可以把它和“地區”,“城市”放到一個分層中進行分析。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM