Tableau 之一 連接數據源


導入數據源

與各類數據源建立連接關系,是使用tableau探索分析數據的第一步,本節內容包括:

  • 數據源類型
  • 連接數據源

數據源類型

打開tableau,可以在左側窗口看到連接選項,目前tableau可以連接70多種數據源類型,這些數據源大體可以分為兩類,分別是本地數據源和服務器數據源。

“數據源”:數據的來源,包括文件、數據庫、服務器等。

tableau支持的本地數據源包括Excel、txt、csv、json等各類常見的源數據格式,還支持多種空間文件, 為使用地圖分析提供了條件。

1534950063582

tableau支持的服務器數據源包括各類數據庫(如Mysql、Oracle、MongoDB)、在線數據服務(如google analtics)等,可以根據使用需要,與目標服務器數據源建立連接關系,實時或提取數據進行分析。

1534950270978

連接數據源

tableau自帶的超市示例的字段比較多,剛開始學習tableau的時候,會有一種眼花繚亂、不知從何下手的感覺。因此,在此專門構造了一個數據集demo,以便於更直觀的學習數據連接操作。該數據集demo為EXCEL工作簿,包含有“書籍”和“作者”兩張數據表單,其中“書籍”數據表包括書名、作者、作者ID、出版社4個字段,“作者”數據表包括作者、作者ID、國籍3個字段。

1534950854020

通過EXCEL導入數據集

操作步驟:

  1. 打開tableau,在左側連接窗口點擊“Excel”;
  2. 在文件對話框找到准備導入的數據集。

1534951403568

根據操作步驟,找到並打開需要導入的excel工作薄后,即可進入數據源管理頁面。該頁面分為四個功能區,分別是畫布區、數據區、數據源區、工作表區,可以對導入的數據源進行各種管理操作,如連接多個數據源、確定數據源之間的連接方式、修改字段名、隱藏字段、調整字段屬性等。

1534957372503

  • 數據源區:導入的數據源連接,可以是一個數據源,也可以是多個數據源。
  • 工作表區:對應每一個數據源的工作表,每個工作表都是一個數據表單。
  • 畫布區:對某個工作表或多個工作表彼此間關系進行聯接等操作的區域,比如選擇數據提取方式(實時、提取)、確定多個工作表的連接方式(如內連接、外連接)等。
  • 數據網格區:對各個工作表的數據表單進行展現、操作的區域,可以查看及重命名字段名稱、更換字段類型(如字符串、數字、日期)、創建計算等。

通過MySQL導入數據集

為測試tableau與MySQL的連接及數據導入,首先在本地MySQL數據庫建立名為book的數據庫demo,里面有一個“書籍2”數據表,該表包含書名、作者、作者ID、出版社4個字段。

1534953236038

操作步驟:

  1. 打開tableau,在左側連接窗口點擊“MySQL”;
  2. 在彈出的對話框填寫MySQL服務器的地址、端口、用戶名和密碼,均正確無誤后即可進入數據源頁面。

完成對MySQL數據庫數據的導入后,即進入數據源管理頁面,該頁面與Excel方式導入的數據源管理頁面完全一致,只是在數據源區的連接位置顯示了“MySQL”,表明該數據源的類型。

1534952421492

通過剪貼板導入數據集

在tableau中導入數據還有更簡單的方式,即通過復制粘貼操作直接一步導入數據集。

導入步驟:

  1. 在數據源選擇好目標數據,並進行復制操作(Ctrl+C );
  2. 打開tableau,在連接窗口進行粘貼操作(Ctrl+V );
  3. 數據導入成功,tableau跳轉到數據源頁面。

1534953522715

通過粘貼復制數據的數據源管理頁面與其他方式導入的數據源管理頁面完全一致,只是在數據源區的連接位置顯示了“文本文件”,表明該數據源的類型。需要注意的是,通過復制粘貼數據進入到數據源頁面后,在數據源區可能出現“使用數據解釋器”的選擇項,如此次操作就出現了該選擇項,需要檢查是否對其進行勾選。

數據解釋器:tableau通過數據解釋器自動對數據源的附加表、子表、分層頁眉、無關的頁眉和頁腳,或者空白行和列進行檢測,移除無關信息並優化准備用於分析的數據源。通常,在設置數據源之后,如果 tableau 檢測到數據源存在如上問題,則會提示使用數據解釋器。

個人理解,數據解釋器就是tableau認為我們數據源中的數據存在這樣或那樣的問題,不適合開展數據分析,或者會影響分析的結果。為避免這些問題的出現,tableau就根據預設的一套規則,對導入的數據源進行優化。但優化的結果可能符合預期,也可能不符合預期,需要我們對其進行檢測后,再確定是否要勾選啟用數據解釋器。

此次復制粘貼數據后出現數據解釋器,表明tableau認為導入的數據可能存在問題,因此需要勾選“數據解釋器” 看它自動優化的結果是否符合預期。 通過勾選,可以看到tableau將數據集中的三個字段標題復制到了數據表中,這樣的處理結果不符合預期,因此針對該數據集,可以使用數據解釋器,即取消勾選項。

1534953494736


本章來源

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM