數據可視化之 圖表篇(六)桑基圖


​可能有些人並不知道什么是桑基圖,讓我們先看一下它長什么樣?這是經濟學人文章中的一張配圖:

 

 

你沒有見過也正常,這算是一個比較小眾的圖表。

它通常應用於具有流向關系的數據可視化分析,數據從左邊的項目流向右邊的項目,項目條的寬度表示數據的大小,流向條的寬度對應數據流量的大小。

這個圖表最早可追溯到1898年,因Matthew Henry Phineas Riall Sankey繪制“蒸汽機的能源效率圖”而聞名,此后便以其名字命名為Sankey Chart(桑基圖)。

下面來看看PowerBI如何制作桑基圖。

這是一個自定義圖表,先從市場中添加進來,

添加到畫布以后,可以看到它需要的幾個字段,其中【源】和【目標】是必填字段,其他三個字段是可選字段。以即將上映的2020賀歲檔電影為例,

 

 

將字段[類型]放入到【源】中,[電影]放到【目標】中,一個桑基圖就生成了,

 

 

因每部電影可以划分為不同的類別,從這個圖表中,可以直觀的看到每個分類有幾部影片,也能看出每個影片分屬什么類別。

 

可以在格式中調整流向條的顏色,

 

 

調整以后,效果是不是看起來好多了,

 

 

現在顏色設置還不是很方便,每個流向都要單獨調整,並且,欄目條無法直接更改配色,只能通過主題來調整。

上面這個桑基圖只用了兩個字段,並沒有用到數據,所以,每個流向分支條的寬度都一樣,並且也只有一層流向關系。

 

下面來制作個稍微復雜一點的桑基圖。

模擬一個手機用戶畫像數據如下:

 

 

將源和目標分別放到對應的字段框中,人數放到value中,即可生成下面的桑基圖,

 

 

 

這是一個雙層桑基圖,因為在這個數據中,【目標】中的類別,比如華為手機,在下面,繼續成為【源】進一步分解,桑基圖將自動識別這一特征。同樣的方式,可以生成更多層級的桑基圖。

並且由於每個流向的數據不一樣,桑基圖中的流線也寬窄不一,通過點擊某個類別,可以很直觀看到數據從哪里來,流向到哪里去。

 

 

如果需要特別關注某個類別,還可以把該類別對應的數據條移到特定的位置,更容易識別。

比如,想關注“蘋果手機”的用戶畫像,

 

 

桑基圖還有個的特征是,流出端和流入端的數據一般都是相等的,即分支寬度總和相等,就像能量守恆定律一樣。

通過這兩個案例,你也可以看出桑基圖的使用場景,其實不僅僅是流向的數據,只要是具有層級的分類數據,都可以用桑基圖來展現,你也可以用它來發掘有趣的應用方式。

 

雖然在Power BI中可以輕松做出桑基圖,但在設置上還有很多不足之處,比如對顏色設置非常麻煩、數據條移動后對齊困難等,期待后續的進一步優化。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM