數據可視化:就是使用圖形圖表等方式來呈現數據,圖形圖表能夠高效清晰地表達數據包含的信息。
Seaborn是基於matplotlib,在matplotlib的基礎上進行了更高級的API封裝,便於用戶可以更加簡便地做出各種有吸引力的統計圖表。
可以說,seaborn是matplotlib的很好補充,而且能夠高度兼容numpy與pandas數據結構以及scipy與statsmodels等統計模式。
安裝:pip install seaborn
seaborn的主要功能有:
- 內置主題
- 豐富的調色板,更好的顯示數據信息
- 對變量分布進行了可視化
- 數據矩陣可視化,並使用聚類算法發現這些矩陣中的結構
- 對自變量和因變量之間的線性回歸結果進行可視化
- 繪制統計時間序列,並將其不確定性可視化
- 構建高級、抽象的網格圖,可輕松將復雜問題可視化
Seaborn是一個在Python中制作有吸引力和信息豐富的統計圖形的庫。它建立在matplotlib之上,並與PyData堆棧緊密集成,包括支持來自scipy和statsmodels的numpy和pandas數據結構和統計例程。 Seaborn旨在將可視化作為探索和理解數據的核心部分。繪圖函數對包含整個數據集的數據框和數組進行操作,並在內部執行必要的聚合和統計模型擬合以生成信息圖。如果matplotlib“試圖讓事情變得簡單容易和難以實現”,seaborn會試圖使一套明確的方案讓事情變得容易。 Seaborn可以認為是對matplotlib的補充,而不是它的替代品。在數據可視化方面能夠很好的表現。
分類統計圖
(1)統計柱狀圖barplot(均值和置信區間)
(2)灰度柱狀圖countplot
(3)點圖pointplot(均值和置信區間)
分類散點圖
當有一維數據是分類數據時,散點圖成為了條帶形狀:
(1)航線圖stripplot,設置參數添加抖動方法jitter=True(點的直接展示)
(2)生成蜂群圖swarmplot,避免散點重疊(點的直接展示)
分類分布圖
(1)箱式圖boxplot:上下邊緣、上下四分位數、中位數(近似分布)
(2.1)提琴圖violinplot:箱式圖 + KDE((近似分布))
(2.2)非對稱提琴圖:violinplot里的split=True參數
分類統計子圖
(1)單分類標准的子圖factorplot
(2)多分類標准的子圖PairGrid
矩陣圖