用seborn的函数distplot(), jointplot(), pairplt()对数据的单变量分析绘图


1.用seaborn的distplot()函数绘制直方图。参数kde = True时会把分布曲线也画出来。

如下代码所示是绘制标准正态分布的分布图

1 import seaborn as sns
2 import numpy as np
3 import matplotlib as mpl
4 import matplotlib.pyplot as plt
5 
6 
7 x = np.random.normal(size=1000)
8 sns.distplot(x)
9 plt.show()

2.对于两组变量关系,可以用散点图画出他们的分布。函数是jointplot()。

如下代码是绘出二维正态分布的散点图

 1 import seaborn as sns
 2 import numpy as np
 3 import pandas as pd
 4 import matplotlib as mpl
 5 import matplotlib.pyplot as plt
 6 
 7 
 8 data = np.random.multivariate_normal(mean=[0, 0], cov=[[1, 0], [0, 1]], size=1000)  #1000组标准二维正态分布
 9 df = pd.DataFrame(data=data, columns=["x", "y"])
10 sns.jointplot(x="x", y="y", kind="hex", data=df)
11 plt.show()

  data是一个长度为1000的ndarray类型,每个元素又是一个二维向量,分别是二维正态分布的两个随机变量的样本值。所以可以当成是1000*2的矩阵

  利用DataFrame函数将ndarray变成DataFrame结构,然后利用jointplot()画出散点图。其中如果kind=“scatter”则是普通散点图,这里为了避免样本太多,普通的散点图可能连成一片看不出分布差异,

用kind=“hex"来画,运行结果如下

 3.最强大的函数应该是pairplot函数,它能对DataFram的属性两两配对绘制散点图,并且对某一属性绘制直方图

如下代码所示,iris是seaborn内置数据集

1 import seaborn as sns
2 import numpy as np
3 import pandas as pd
4 import matplotlib as mpl
5 import matplotlib.pyplot as plt
6 
7 iris = sns.load_dataset("iris")   #seaborn内置数据集,DaraFram类型
8 sns.pairplot(iris, kind="hex")
9 plt.show()

运行结果如下

 


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM