python3绘图和可视化(一)


      绘图是数据分析工作中最重要的任务之一,是探索过程的一部分。python有许多可视化工具,下面主要学习matplotlib

matplotlib是一个用于创建出版质量图表的桌面绘图包(主要是2D方面)。该项目是由John Hunter于2002年启动的,其目的是为了python构建一个MATLAB式的绘图接口。如果结合使用一种GUI工具包(如IPython),matplotlib还具有诸如缩放和平移等交互功能。它不仅支持各种操作系统上许多不同的GUI后端,而且还能将图片导出为各种常见的矢量(vector)和光栅(raster)图:PDF、SVG、JPG、PNG、BMP、GIF等。

要使用文中的代码实例,要确保我们的IPython是以Pylab模式启动的(ipython --pylab),或通过%gui魔术命令打开了GUI事件循环集成。

一.matplotlib API入门

使用matplotlib的方法有很多种,最常用的方式是Pylab模式的IPython(ipython --pylab)。这样会将IPython配置为使用我们所指定的matplotlib GUI后端(Tk、wxPython、PyQt、Mac OS X native、GTK).对大部分用户而言,默认的后端就已经够用了。Pylab模式还会向IPython引入一大堆模块和函数以提供一种更接近于MATLAB的界面。绘制一张简单的图表即可测试是否一切准备就绪:

In [1]: plot(np.arange(10))
Out[1]: [<matplotlib.lines.Line2D at 0xfb13518>]

 

matplotlib API函数(如plot和close)都位于matplotlib.pyplot模块中,其通常的引入约定是:

import matplotlib.pyplot as plt

虽然pandas的绘图函数能够处理许多普通的绘图任务,但如果需要自定义一些高级功能的话就必须学习matplotlib API。

1.Figure和Support

matplotlib的图像都位于Figure对象中。我们可以用plt.figure创建一个新的Figure:

In [4]: fig=plt.figure()  

这时会弹出一个空窗口(不要关闭空窗口)。plt.figure有一些选项,特别是figsize,它用于确保当图片保存到磁盘时具有一定的大小和纵横比。matplotlib中的Figure还支持一种MATLAB式的编号架构(例如plt.figure(2))。通过plt.gcf()即可得到当前Figure的引用。

不能通过空Figure绘图。必须用add_subplot创建一个或多个subplot才行:

In [5]: ax1=fig.add_subplot(2,2,1)

这条代码的意思是:图像应该是2X2的,且当前选中的是4个subplot中的第一个(编号从1开始)。如果再把后面两个subplot也创建出来,最终得到的图像如下图所示:

In [6]: ax2=fig.add_subplot(2,2,2)

In [7]: ax3=fig.add_subplot(2,2,3)

 

如果这时发出一条绘图命令(如plt.plot([1.8,3.8,-6,1.9])),matplotlib就会在最后一个用过的subplot(如果没有则创建一个)上进行绘制。因此,如果我们执行下列命令,我们就会得到如下图所示的结果:

In [12]: from numpy.random import randn

In [13]: plt.plot(randn(50).cumsum(),'k--')
Out[13]: [<matplotlib.lines.Line2D at 0xd8e6ef0>]

 

"k--"是一个线性选项,用于告诉matplotlib绘制黑色虚线图。上面那些由fig.add_subplot所返回的对象是AxesSubplot对象,直接调用它们的实例方法就可以在其他空着的格子里面画图了,如下图所示:

我们可以在matplotlib的文档中找到各种图表类型。由于根据特定布局创建Figure和subplot是一件非常常见的任务,于是便出现了一个更为方便的方法(plt.subplots),它可以创建一个新的Figure,并返回一个含有已创建的subplot对象的NumPy数组:

In [10]: fig,axes=plt.subplots(2,3)

 

 

In [11]: axes
Out[11]:
array([[<matplotlib.axes._subplots.AxesSubplot object at 0x000000000D6C47F0>,
<matplotlib.axes._subplots.AxesSubplot object at 0x000000000D8172E8>,
<matplotlib.axes._subplots.AxesSubplot object at 0x000000000D83C860>],
[<matplotlib.axes._subplots.AxesSubplot object at 0x000000000D864DD8>,
<matplotlib.axes._subplots.AxesSubplot object at 0x000000000D925390>,
<matplotlib.axes._subplots.AxesSubplot object at 0x000000000D94E1D0>]],
dtype=object)

 这是非常实用的,因为可以轻松地对axes数组进行索引,就好像是一个二维数组一样,例如,axes[0,1]。我们还可以通过sharex和sharey指定subplot应该具有相同的X轴或Y轴。在比较相同范围的数据时,这也是非常实用的,否则,matplotlib会自动缩放各图表的界限。有关该方法的更多信息,参见下表

参数                   说明

nrows           subplot的行数

ncols             subplot的列数

sharex           所有subplot应该使用相同的X轴刻度(调节xlim将会影响所有subplot)

sharey           所有subplot应该使用相同的Y轴刻度(调节ylim将会影响所有subplot)

subplot_kw    用于创建各subplot的关键字字典

**fig_kw         创建figure时的其他关键字,如plt.subplots(2,2,figsize=(8,6))
 

调整subplot周围的间距

默认情况下,matplotlib会在subplot外围留下一定的边距,并在subplot之间留下一定的间距。间距跟图像的高度和宽度有关,因此,如果我们调整了图像大小(不管是编程还是手工),间距也会自动调整。利用Figure的subplots_adjust方法可以轻而易举地修改间距,此外,它也是个顶级函数:

subplot_adjust(left=None,bottom=None,right=None,top=None,wspace=None,hspace=None)

wspace和hspace用于控制宽度和高度的百分比,可以用作subplot之间的间距。下面是一个简单的例子,其中将间距收缩到0,如下图所示:

In [1]: import matplotlib.pyplot as plt

In [2]: fig=plt.figure()

In [3]: ax1=fig.add_subplot(2,2,2)

In [4]: ax2=fig.add_subplot(2,2,3)

In [5]: from numpy.random import randn

In [6]: fig,axes=plt.subplots(2,2,sharex=True,sharey=True)

In [7]: for i in range(2):
...: for j in range(2):
...: axes[i,j].hist(randn(500),bins=50,color='k',alpha=0.5)
...:

In [8]: plt.subplots_adjust(wspace=0,hspace=0)

不难看出,其中的轴标签重叠了。matplotlib不会检查标签是否重叠,所以对于这样情况,我们只能自己设定刻度位置和刻度标签。后面将会详细介绍该内容。

颜色、标记和线型

matplotlib的plot函数接受一组X和Y坐标,还可以接受一个表示颜色和线型的字符串缩放。例如,要根据x和y绘制绿色虚线,我们可以执行如下代码:

ax.plot(x,y,'g--')

这种在一个字符串中指定颜色和线型的方式非常方便。通过下面这种更为明确的方式也能得到同样的效果:

ax.plot(x,y,linestyle='--',color='g')

常用的颜色都有一个缩写词,要使用其他任意颜色则可以通过指定其RGB值的形式使用(例如,‘#CECECE’)。

线型图还可以加一些标记(marker),以强调实际的数据点。由于matplotlib创建的是连续的线型图(点与点之间插值),因此有时可能不太容易看出真实数据点的位置。标记也可以放到格式字符串中,但标记类型和线型必须放在颜色后面:

In [24]: plt.plot(randn(30).cumsum(),'ko--')
Out[24]: [<matplotlib.lines.Line2D at 0x105ce208>]

还可以将其写成更为明确的形式:

In [25]: plot(randn(30).cumsum(),color='k',linestyle='dashed',marker='o')
Out[25]: [<matplotlib.lines.Line2D at 0x10608278>]

在线型图中,非实际数据点默认是按线性方式插值的。可以通过drawstyle选项修改:

In [26]: data=randn(30).cumsum()

In [27]: plt.plot(data,'k--',label='Default')
Out[27]: [<matplotlib.lines.Line2D at 0x107c20f0>]

In [29]: plt.plot(data,'k--',drawstyle='steps-post',label='steps-post')
Out[29]: [<matplotlib.lines.Line2D at 0x107d9ac8>]

In [31]: plt.legend(loc='best')
No handles with labels found to put in legend.
Out[31]: <matplotlib.legend.Legend at 0x10d2f080>

刻度、标签和图例

对于大多数的图表装饰项,其主要实现方式有二:使用过程型的pyplot接口(MATLAB用户非常熟悉)以及更为面向对象的原生matplotlib API。

pyplot接口的设计目的就是交互式使用,含有诸如xlim、xticks和xticklabels之类的方法。它们分别控制图表的范围、刻度位置、刻度标签等。其使用方式有以下两种:

(1)调用时不带参数,则返回当前的参数值。例如,plt.xlim()返回当前的X轴绘图范围。

(2)调用时带参数,则设置参数值。因此,plt.xlim([0,10])会将X轴的范围设置为0到10。

所有这些方法都是对当前或最近创建的AxesSuplot起作用的。它们各自对应subplot对象上的两个方法,以xlim为例,就是ax.get_xlim和ax.set_xlim。本人更喜欢使用subplot的实例方法(因为本人喜欢明确的事情,而且在处理多个subplot时这样也更清楚一些)。当然我们完全可以选择自己觉得方便的那个。

 

设置标题、轴标签、刻度以及刻度标签

为了说明轴的自定义,我们将创建一个简单的图像并绘制一段随机漫步:

In [34]: fig=plt.figure()

In [35]: ax=fig.add_subplot(1,1,1)

In [36]: ax.plot(randn(1000).cumsum())
Out[36]: [<matplotlib.lines.Line2D at 0x108361d0>]

要修改X轴的刻度,最简单的办法是使用set_xticks和set_xticklabels。前者告诉matplotlib要将刻度放在数据范围中的哪些位置,默认情况下,这些位置也就是刻度标签。但我们可以通过set_xticklabels将任何其他的值用作标签:

In [37]: ticks=ax.set_xticks([0,250,500,750,1000])

In [38]: labels=ax.set_xticklabels(['one','two','three','four','five'],rotation
...: =30,fontsize='small')

最后,再用set_xlabel为X轴设置一个名称,并用set_title设置一个标题:

In [6]: ax.set_title('My first matplotlib plot')
Out[6]: Text(0.5, 1.0, 'My first matplotlib plot')

In [7]: ax.set_xlabel('Stages')
Out[7]: Text(0.5, 10.763891973024519, 'Stages')

最终的结果如下图所示。Y轴的修改方式与此类似,只需将上述代码中的x替换为y即可。

添加图例 

图例(legend)是另一种用于标识图表元素的重要工具。添加图例的方式有二。最简单的是在添加subplot的时候传入label参数:

In [9]: fig=plt.figure();ax=fig.add_subplot(1,1,1)

In [10]: ax.plot(randn(1000).cumsum(),'k',label='one')
Out[10]: [<matplotlib.lines.Line2D at 0xd638320>]

In [11]: ax.plot(randn(1000).cumsum(),'k--',label='two')
Out[11]: [<matplotlib.lines.Line2D at 0xd663128>]

In [12]: ax.plot(randn(1000).cumsum(),'k.',label='three')
Out[12]: [<matplotlib.lines.Line2D at 0xd6a2208>]

在此之后,我们可以调用ax.legend()或plt.legend()来自动创建图例:

In [13]: ax.legend(loc='best')
Out[13]: <matplotlib.legend.Legend at 0xd6f52e8>

如下图所示。loc告诉matplotlib要将图例放在哪。如果我们不是吹毛求疵的话,"beat"是不错的选择,因为它会选择最不碍事的位置。要从图例中去除一个或多个元素,不传入label或传入label='_nolegend_'即可。

 注解以及在subplot上绘图

除标准的图表对象之外,我们可能还希望绘制一些自定义的注解(比如文本、箭头或其他图形等)。注解可以通过text、arrow和annotate等函数进行添加。text可以将文本绘制在图表的指定坐标(x,y),还可以加上一些自定义格式:

ax.text(x,y,'Hello world!'.family='monospace',fontsize=10)

注解中可以既含有文本也含有箭头。例如,我们用箭头和文本注解如下图的波浪线

In [1]: import matplotlib.pyplot as plt

In [2]: fig=plt.figure()

In [3]: ax=fig.add_subplot()

In [4]: ax=fig.add_subplot(1,1,1)

In [5]: import numpy as np

In [7]: t=np.arange(0,5,0.01)

In [9]: s=np.cos(2*np.pi*t)

In [10]: line,=ax.plot(t,s,lw=2)

In [11]: ax.annotate('local max',xy=(2,1),xytext=(3,1.5),arrowprops=dict(faceco
...: lor='black',shrink=0.05),)
Out[11]: Text(3, 1.5, 'local max')

In [13]: ax.set_ylim(-2,2)
Out[13]: (-2, 2)

 

 图形的绘制要麻烦一些。matplotlib有一些表示常见图形的对象。这些对象被称为块(patch)。其中有些可以在matplotlib.pyplot中找到(如Rectangle和Circle),但完整集合位于matplotlib.patches。

要在图表中添加一个图形,我们需要创建一个块对象shp,然后通过ax.add_patch(shp)将其添加到subplot中(如下图所示):

In [26]: fig=plt.figure()

In [27]: ax=fig.add_subplot(1,1,1)

In [28]: rect=plt.Rectangle((0.2,0.75),0.8,0.25,color='k',alpha=0.3)

In [29]: circ=plt.Circle((0.7,0.2),0.1,color='b',alpha=0.3)

In [30]: pgon=plt.Polygon([[0.15,0.15],[0.35,0.6],[0.2,0.8]],color='g',alpha=0.
...: 5)

In [31]: ax.add_patch(rect)
Out[31]: <matplotlib.patches.Rectangle at 0xdb339b0>

In [32]: ax.add_patch(circ)
Out[32]: <matplotlib.patches.Circle at 0xdb33780>

In [33]: ax.add_patch(pgon)
Out[33]: <matplotlib.patches.Polygon at 0xda5c828>

如果查看许多常见图表对象的具体实现代码,我们就会发现它们其实就是由块组装而成的。

 将图表保存到文件

利用plt.savefig可以将当前图表保存到文件。该方法相当于Figure对象的实例方法savefig。例如,要将图表保存为SVG文件,我们只需输入:

plt.savefig('figpath.svg')

文件类型是通过文件扩展名推断出来的。因此,如果我们使用的是.pdf,就会得到一个PDF文件。在发布图片时最常用到两个重要的选项是dpi(控制“每英寸点数”分辨率)和bbox_inches(可以剪除图表周围的空白部分)。要得到一张带有最小白边且分辨率为400DPI的PNG图片,我们可以:

plt.savefig('figpath.png',dpi=400,bbox_inches='tight')

savefig并非一定要写入磁盘,也可以写入任何文件型的对象,比如StringIO:

from io import StringIO

buffer=StringIO()

plt.savefig(buffer)

plot_data=buffer.getvalue()

这对在Web上提供动态生成的图片是很实用的。

Figure.savefig方法的部分参数及说明如下表所示:

参数                            说明

fname              含有文件路径的字符串或Python的文件型对象。图像格式由文件扩展名推断得出,例如,.pdf推断出PDF,.png推断出PNG

dpi                 图像分辨率(每英寸点数),默认为100

facecolor、edgecolor  图像的背景色,默认为“w”(白色)

format          显式设置文件格式(“png”、”pdf”、“svg”、“ps”、“eps”......)

bbox_inches  图表需要保存的部分。如果设置为“tight”,则将尝试剪除图表周围的空白部分

matplotlib配置

matplotlib自带一些配色方案,以及为生成出版质量的图片而设定的默认配置信息。幸运的是,几乎所有默认行为都能通过一组全局参数进行自定义,它们可以管理图像大小、subplot边距、配色方案、字体大小、网格类型等。操作matplotlib配置系统的方式主要有两种。第一种是Python编程方式,即利用rc方法。比如说,要将全局的图像默认大小设置为10X10,我们可以执行:

 plt.rc('lines',linewidth=10)

rc的第一个参数是希望自定义的对象,如'lines'、'axes'、‘xtick’、'ytick'、'grid'、'legend'等。其后可以跟上一系列的关键字参数。最简单的办法是将这些选项写成一个字典:

font_options={'family':'monospace',

                        'weight':'bold',

                        'size':'small'}

plt.rc('font',**font_options)

要了解全部的自定义选项,查阅https://matplotlib.org/api/_as_gen/matplotlib.pyplot.rc.html?highlight=rc#matplotlib.pyplot.rc。如果对该文件进行了自定义,并将其放在自己的.matplotlib目录中,则每次使用matplotlib时就会加载该文件。

例子,绘出地球的两极

In [1]: import matplotlib.pylab as plt

In [2]: import numpy as np

#自定义图像

In [3]: plt.rc('grid',color='#316931',linewidth=1,linestyle='-')

In [4]: plt.rc('xtick',labelsize=15)

In [5]: plt.rc('ytick',labelsize=15)

#绘出一个图像

In [6]: fig=plt.figure(figsize=(8,8))

#在上面图像上绘出两极图形

In [7]: ax=fig.add_axes([0.1,0.1,0.8,0.8],projection='polar',facecolor='#d5de9c
...: ')

#两极上绘出两条线

In [8]: r=np.arange(0,3.0,0.01)

In [9]: theta=2*np.pi*r

In [10]: ax.plot(theta,r,color='#ee8d18',lw=3,label='a line')
Out[10]: [<matplotlib.lines.Line2D at 0xfb00da0>]

In [11]: ax.plot(0.5*theta,r,color='blue',ls='--',lw=3,label='another line')
Out[11]: [<matplotlib.lines.Line2D at 0xfb4c080>]

In [12]: ax.legend()
Out[12]: <matplotlib.legend.Legend at 0xfb58630>

In [13]: plt.show()

 


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM