Tableau 之四 數據類型


 

tableau對數據和字段有着特定的定義方式,弄清楚他們的具體含義,將有助於理解tableau的工作方式,從而更好的讓tableau為我所用。本節內容包括:

  • 數據類型
  • 維度與度量
  • 離散與連續

數據類型

數據類型分類

數據源的所有字段在tableau中都會被分配一個數據類型,同時 tableau還會在各字段前加上一個特定的標識,用以直觀提示該字段是哪一種數據類型,tableau中的數據類型主要有文本值、日期值、日期和時間值、數字值、布爾值、地理值六類。

圖:tableau的數據類型

圖:tableau的數據類型

數據類型調整

每一個字段都有着屬於自己的數據類型圖標,當然,tableau分配給字段的數據類型並不總是准確的,是可以根據實際分析需求進行調整的。比如,它可能會將日期字段“年-月-日”(如2017-10-09)解釋為文本,但我們需要用該字段進行時間分析,則必須將其調整為日期類型;比如,它可能會將地理位置字段“ 省市”(如深圳、湖南)解釋為文本,但我們需要用該字段匹配地理位置,這就必須將其調整為地理值類型。

圖:數據類型示例

圖:數據類型調整示例

需要注意的是,有的字段的數據類型圖標前面,多了一個“=”,這表名該字段是tableau中的自定義數據類型,如“=#”表示自定義的數字值字段,“=Abc”表示自定義的文本值字段,“=T|F”表示自定義的布爾值字段。這些字段一般都是通過“計算字段”功能獲取。

圖:自定義字段示例

圖:自定義字段示例

維度與度量

維度和度量是tableau中非常重要的字段類型,進入工作表工作區后,數據窗口中就直接顯示了維度和度量兩個區域,數據源中的各字段被tableau智能分配字段類型后,逐一分配到這兩個區域中,可以說,維度和度量是使用tableau開展數據分析時,需要掌握的最基本概念。

圖:維度和度量區域示例

圖:維度和度量區域示例

維度

維度是觀察數據的角度以及對數據的描述,維度可以用文本、時間表示,也可以用數值表示,簡單理解,EXCEL首行字段中,非數值型的字段就可以看作是維度。數據源導入后,tableau會將離散分類信息的所有字段(比如值為字符串、布爾值的字段)分配到維度區域。

圖:Excel首航字段示例

圖:Excel首行字段示例

將“維度”字段拖到列或行功能區后,tableau就會將該字段以坐標軸的橫軸或縱軸標題形式,體現在圖表中。

圖:維度字段在圖表中的示例

圖:維度字段在圖表中的示例

度量

度量通常是數值信息,數據源導入后,tableau會將數值型的所有字段分配到度量區域。將“度量”字段拖到列或行功能區后,tableau會在視圖區顯示為軸。通常,維度字段在拖到列行功能區后,一般會默認進行聚合計算。

軸是一個顯示最小值和最大值之間的值的度量線。

圖:度量字段示例

圖:度量字段示例

轉換

盡管大部分情況,tableau能夠自動並且准確地將各個字段划入到“維度”或“度量”區域,但有的時候,它也會出錯,或者說它的划分與我們的實際想法有出入。

舉個例子,郵政編碼是由一串數字組成,tableau會將其划入到“度量”,但實際上,郵政編碼通過是作為分類信息來處理,如統計同一郵政編碼客戶的相關數據,而不是對郵政編碼進行求和、求平均數、求最大最小值等計算。

再舉個例子,產品的“價格”字段是數字型,tableau也會將其划入到“度量”,可以對產品價格進行求和、求平均等計算,但如果希望統計各個價格或某價格區間的產品銷量,作為“度量”字段的“價格”顯然不能滿足分析需要,這時就需要將“價格”字段從“度量”轉換為“維度”。

圖:"價格"字段轉換為維度示例

圖:"價格"字段轉換為維度示例

需要注意的是,通常情況下,維度字段是藍色,度量字段是綠色,可以作為區分維度和度量的直觀依據,但依靠顏色來判別一個字段是維度還是度量並不可靠,如果在行列工作區直接將一個度量字段轉換為維度,雖然該字段取消了聚合運算狀態,但其顏色仍然是綠色,並沒有變為藍色。因此,辨別視圖中的字段是度量還是維度的依據在於該字段是否已聚合,聚合的是度量,未聚合的是維度。

圖:度量轉換為維度示例

圖:度量轉換為維度示例

離散與連續

離散與連續是另一種數據角色分類,辨別視圖中的字段是離散還是連續的依據在字段顏色,藍色是離散字段,綠色是連續字段。

離散

在數學上,“離散”指“各自分離且不同”。在tableau中將字段從數據窗口的“維度”區域拖到列行功能區時,tableau會默認該字段為離散字段,並將該字段的每一個值在視圖中顯示為行或列的標題。

需要注意的是,離散字段在視圖中只是標題,並不是軸,如下圖中,根據“價格”字段創建的標題展示了“價格”字段中的每一個價格值,這里只能使用散點圖、條形圖等圖形,不能使用折線圖。

圖:離散字段示例

圖:離散字段示例

連續

在數學上,“連續”是指“構成一個不間斷的整體,沒有中斷”。在tableau中,連續字段被拖到列行功能區時,tableau會創建軸,軸上是連續刻度。

與離散字段不同,連續字段創建的軸,是一個范圍值,如下圖中,“價格”字段創建的軸的刻度表示在0-110元之間,是連續的,因此可以使用折線圖。

圖:連續字段示例

圖:連續字段示例


本章來源 后續延申https://blog.csdn.net/springyang2015/article/category/7975558


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM