本文將講解Tableau的基本使用和簡單的數據分析。
在Tableau首頁,我們可以看到有多種連接方式:文本文件、Excel、JSON文件、數據庫等。
1.連接文本文件
點擊“連接”下的“文本文件”,選擇要導入的文件,如下圖:
連接到文件后,鼠標右鍵文件名,選擇文本中的字段分隔符:
連接Excel等其他文件的方法與連接文本文件的類似,這里不再贅述。
2.連接數據庫
這里選擇的是連接Oracle數據庫,連接數據庫的方法基本一樣,以此類推:點擊要連接的數據庫,填寫“服務器地址”、“端口號”、“用戶名”和“密碼”,點擊登錄,如下圖:
3.從剪貼板粘貼文件
選擇並復制要導入的文件內容,點擊工作簿空白區域按“ctrl+v”粘貼,即可。
連接到指定的數據源后,接下來,我們將通過Tableau對數據進行可視化分析。我們選擇的是全球超市數據(Excel),如下圖:
連接到此Excel文件后,選擇要使用的工作表,將其拖到指定位置,如下圖:
如果需要其它數據源的相關數據,我們只需要點擊“添加”,通過添加連接創建整合式數據源。我們在這里引入關於被退回訂單的“.csv”文本文件,如下圖:
Tableau會自動創建默認聯接,如下圖所示,點擊聯接圖標即可查看和編輯聯接的詳細信息,我們選擇左聯接,這樣既可以獲取“訂單”表格的所有信息,又可以引入被退回交易的相關“退回”信息。訂單ID已經被用作聯接子句,但我們可以根據需要改變聯接子句。
我們可以在這個網格視圖中進行一些基本的元數據管理。只需點擊圖標,我們就可以將行ID從“數字”改為“字符串”。此數據集中的“訂單ID”字段包含多個部分,如果我們想拆分此字段並且僅保留前面的配送中心代碼,只需點擊字段名旁的下拉菜單選擇“自定義”拆分即可。
接下來,我們可以決定是實時連接還是數據提取。
如果數據不斷變化,或者希望利用高性能數據庫,實時連接是很不錯的選擇。我們也可以選擇通過數據提取把數據導入 Tableau 的快速數據引擎。這樣可以獲得離線數據,並讓我們能夠將關鍵系統受到的性能影響降到最低,同時仍然可以定期進行計划刷新,保持數據時效性。
我們將實時連接並單擊底部的工作表標簽。進入以下界面:
現在,我們開始可視化數據:
我們分別將“維度”和“度量”的“類別”字段拖至行,“細分市場”拖至行,“數量”拖至列,“市場”拖至列,同時再將“市場”拖至“顏色”,如下圖:
通過此圖表我們可以很清晰的看到,非洲市場的銷售量非常少。
如果我們想看銷售總數,將“銷售額”放入視圖,如果我們想看到隨時間推移的銷售情況,可以將“訂購日期”拖到視圖頂部,Tableau會以年度匯集日期。我們可以點擊“加號 (+)”將其展開,如下圖:
要查看幾年來所有第 1 季度的情況,我們可以輕松透視數據,讓“季度”在“年份”前面。這樣,我們就可以比較這幾年各季度的增長情況。把“年份”移動到“顏色”,就會以豎列的形式顯示所有年份,如下圖:
如果我們不想繼續展開,只是想把季度改成月份,可以點擊“季度訂購日期”的下拉菜單進行更改,如下圖:
如果我們想知道年同比增長,點擊“總計銷售額”的下拉菜單,選擇“快速表計算”,選擇“年度同比增長”,如下圖:
如果想讓年度同比增長值顯示在工具提示而不是圖表中,可以將其拖至工具提示功能區。當我們在視圖中的標記上懸停時,工具提示就可以提示此信息,如下圖:
最后,我們再把“類別”拖到行功能區,我們就可以看到哪些類別的銷售情況好,在什么時間段銷售情況好,如下圖: