本文的主要目的是記住最主要的函數,具體的用法還得查API文檔。
首先導入包:
1 %matplotlib inline 2 import numpy as np 3 import pandas as pd 4 from scipy import stats, integrate 5 import matplotlib.pyplot as plt 6 import seaborn as sns 7 sns.set(color_codes=True) 8 np.random.seed(sum(map(ord, "distributions"))) 9 # 生產參數
幾種重要的可視化圖形:
灰度圖
x = np.random.normal(size=100) sns.distplot(x, kde=True)
最重要的是 sns.distplot()
核密度估計
核密度估計的步驟:
- 每一個觀測附近用一個正態分布曲線近似
- 疊加所有觀測的正太分布曲線
- 歸一化
sns.kdeplot(x)
模型參數擬合
雙變量分布
兩個相關的變量
散點圖
sns.jointplot( )
六角箱圖
sns.jointplot( )
核密度估計
sns.jointplot(......., kind="kde") 重要的是后面的那個參數
這個圖,着實有點難啊
也不知道這個是啥
還有這個,
數據集中的兩兩關系
iris = sns.load_dataset("iris")