核密度估計是概率論上用來估計未知的密度函數,屬於非參數檢驗,通過核密度估計圖可以比較直觀的看出樣本數據本身的分布特征
#參數如下: sns.kdeplot(data,data2=None,shade=False,vertical=False,kernel='gau',bw='scott',gridsize=100,cut=3,clip=None,legend=True,cumulative=False,shade_lowest=True,cbar=False, cbar_ax=None, cbar_kws=None, ax=None, *kwargs)
主要用來繪制特征變量y值的分布,看看數據符合哪種分布
用的地方不多,了解為主,不需要深入研究
只有x一個參數
import matplotlib.pyplot as plt import numpy as np import pandas as pd import seaborn as sns sns.set() #切換到sns的默認運行配置 x=np.random.randn(100) plt.plot(x) #這樣是無法看出分布 sns.kdeplot(x)
cumulative :是否繪制累積分布
#是否累計 sns.kdeplot(x,cumulative=True)
shade:若為True,則在kde曲線下面的區域中進行陰影處理,color控制曲線及陰影的顏色
#是否進行陰影處理 sns.kdeplot(x,shade=True,color="g")
vertical:表示以X軸進行繪制還是以Y軸進行繪制
#y軸畫圖 sns.kdeplot(x,vertical=True)
二元kde圖像,很少使用,稍微了解一下即可
#x,y y=np.random.randn(100) sns.kdeplot(x,y) #cbar:參數若為True,則會添加一個顏色棒(顏色幫在二元kde圖像中才有) sns.kdeplot(x,y,shade=True,cbar=True)
全部代碼如下:
import matplotlib.pyplot as plt import numpy as np import pandas as pd import seaborn as sns sns.set() #切換到sns的默認運行配置 x=np.random.randn(100) plt.plot(x) #這樣是無法看出分布 sns.kdeplot(x) #是否累計 sns.kdeplot(x,cumulative=True) #是否進行陰影處理 sns.kdeplot(x,shade=True,color="g") #y軸畫圖 sns.kdeplot(x,vertical=True) #x,y y=np.random.randn(100) sns.kdeplot(x,y) #cbar:參數若為True,則會添加一個顏色棒(顏色幫在二元kde圖像中才有) sns.kdeplot(x,y,shade=True,cbar=True)