tableau基礎知識
- 篩選
- 維度,度量
- 跨數據源(把多個數據源放置到一個數據源)和混合數據源(多個不同的數據源進行關聯)
- 格式--“標記”中的各類操作。
- 分組和分層
Tableau在何處篩選?
有3個地方:
- 摘要/聚合 篩選:
- 比如使用sum函數對不同類別的產品利潤進行聚合計算。然后篩選出產品利潤>0的產品類別。
- 記錄級別篩選
- 針對每條記錄,設置一個條件。
- 數據源篩選。
- 比如,給某個部門的經理發送一個做好的展板。這個經理只能看他們部門的數據。
篩選器的使用順序:
-
數據提取篩選器 (點擊編輯)
-
數據源篩選器
-
如果使用數據提取,那么它對提取的數據進行二次篩選
- 如果使用實時, 那么對實時數據進行篩選。
-
-
上下文篩選器 (即鎖定篩選范圍,它之后的篩選器只會對它篩選出的結果做進一步篩選)(右鍵單擊篩選器膠囊,選擇“上下文篩選”)
-
維度篩選器,⚠️相同級別的篩選器,進行獨立篩選然后並Union.
- 度量篩選
- 表計算的過濾。
維度和度量(藍色和綠色)
系統會為每個字段自動分配一種數據類型(例如整數、字符串、日期)和一個角色:離散維度或連續度量(較常見),或者連續維度或離散度量(不太常見)。
度量名稱和度量值
-
度量名稱:位於維度中,引用所有的度量值作為列名
- 度量值:位於度量中,引用所有的度量值。
使用度量名稱/度量值的篩選器,選擇要顯示的度量值。
聚合, 粒度, 比率計算
粒度:視圖的細分程度。每個點都是一個細分粒度。
聚合操作
使用聚合函數進行計算。tableau的自動功能可更會造成錯誤,這是因為計算方式不一樣,所以要根據需求來判斷是否需要使用聚合函數。
跨數據庫操作,和混合操作
更新(4-20): 參考了一篇文章《如何合並數據》, 對tableau的數據整合有明晰的理解。
更新內容:
從SQL理解:數據表的合並就只有union和join。上下合並和左右相連。
tableau desktop提出的數據混合blend的概念,以及跨數據庫連接的概念,這兩個概念是基於它自身的概念。
借鑒一下圖:
先說跨數據庫連接,我的理解就是SQL的數據表的join。具體方式見👇。
至於為什么desktop要使用這個2個概念:
參考文章認為這2個概念代表了作圖的2大步驟:
我的圖是對原文圖的一種更新:
- 這張圖用來表示的是desktop提出的👆的2個概念的用在哪里。
- 左圈:代表跨數據庫操作。
- 右圈:代表blend數據混合操作。
- ⚠️視圖是數據的直觀表現。
- desktop是作圖和展示工具。並沒有完善的數據整理清洗功能。如原文作者所講,數據並集操作歸類於數據整理。不屬於制作這張圖的目的。
使用數據混合 (使用不同的數據源:即新建數據源)
也可以用於連接,但固定使用左連接;數據混合只能是左聯接,這意味着主表應包含所有可能的值。
如果進行連接,左表就叫主表(用綠色勾表示),右表叫做輔助表(用紅色勾表示)。
⚠️下圖,紅色標簽表示這個表是輔助表。
用“2016年產品”表中的“類別”和“2016年銷售額”的“銷售額”創建一個圖表,使用“2016年銷售額”的“市場”標記。
因此這個例子不適合使用混合。
跨數據庫連接 (也叫集成數據源)
下圖👇把2個來源不同的數據庫,連接到tableau, 然后提取需要的數據表,使用inner join的方式進行表連接。
即:從不同數據庫選擇表進行mysql中的表連接操作。
我的理解:這兩個數據庫中的數據表,存放在tableau的一個數據源內。
這樣創建的新表。就可以了。
但⚠️
- 如果數據表關聯鍵具有一對一關系(也就是說,每個表的鏈接字段中的每個值只有一條記錄),則表聯接更適合。
- 如果表具有一對多或多對多關系,這種方法會在聯接后創建重復的數據。
使用混合還是連接表要考慮:
- 你的目的是什么
- 使用的數據表的特點。使用的主鍵的值是否具有唯一性。
附加:
blend數據混合是desktop中的概念, Prep沒有這個概念!
格式
標簽的使用
即圖上的點的值的顯示方式。
可以對圖上的點的標簽進行多種樣式,顯示方式的設置。
注釋
三種在圖上的注釋:
- 點注釋:可以在圖上的任意位置添加。
- 區域注釋:同上。
- 標記:需要先選擇圖上的點。不能隨意移動,始終有一條線和選中的點相連。
注釋也可以編輯(內容)和設置格式。
工具提示
超強的功能:
- 可以加入語法
- 可以嵌套鏈接
- 可以加入子分析圖表。具體看viz in tooltips視頻。
懸停鼠標在圖表上,顯示信息。
默認下,創建所圖表的所有字段的信息,都會加入到‘工具提示’中。
優化做法,把所有字段,以一句話顯示:
- 內<年(訂購日期)>年<季度(訂購日期)>,<類別>類銷售額為$<總和(銷售額)>,利潤為<總和(利潤)>
強化的功能:
-
當彈出工具提示后,點擊圖上的點,可以臨時鎖定‘工具提示’,然后馬上在‘工具提示’上點擊字段,顯示對應的圖表。
強大的功能-加上語法判斷:
自定義的膠囊,包含着語法:if
最后的效果:
總之:注釋,標簽,工具提示都是輔助看圖的工具。
格式設置
圖表上的任何元素都有相關的格式設置。
另外格式可以從一張圖表復制到另一張圖表。
分組和分層
都是tableau的概念,為了對數據進行方便的操作
分組:
假設一個表地區,有一個列“地區”:包括["東北", “西北”, “華南”,“華中”, “華東”,“西南”] 6個值:
中國北方地區和南方地區的經濟發達程度不同,我們想要以此分為兩個部分:['北方中國', ‘南方中國’]來進行經濟數據的比較分析。
所以,tableau使用分組操作達到這一目的。
右鍵點擊“維度”中的“地區”->在下拉菜單選擇"創建"->"組..."
分層
tableau官方說法是用於“下鑽”。其實就是SQL語法的group by的擴展。
⚠️圖標的樣子。
對應SQL:
select 國家,地區,城市, sum(銷售額) from 銷售表 group by 國家,地區,城市
國家,地區,城市是三個columns字段/列名。
taleau的擴展
tableau對分組的標簽也可以進行分組。
上面創建了一個分組“地區(組)”,可以把它和“地區”,“城市”放到一個分層中進行分析。