Python基礎之數據可視化


在日常工作中,枯燥的文字說明常常會令人望而卻步,不如格式規范的表格容易讓人接受,但通俗易懂的圖表更會讓人耳目一新,賞心悅目。本文主要一個簡單的小例子,簡述Python利用Matplotlib實現數據可視化的相關應用,僅供學習分享使用,如有不足之處,還請指正。

示例場景

當前公司人員冗余,需要裁掉兩名實習生,但是具體裁掉哪一位,領導稍顯為難,舉棋不定。關於兩名實習生的一年銷售額業績,如下表所示:

 那到底哪一位實習生的銷售業績,及未來潛力更好呢?讓我們通過可視化的方式進行對比。

引入模塊包

工欲善其事必先利其器,要進行數據分析和可視化,首先是引入pandas模塊和matplotlib模塊,如下所示:

1 import pandas as pd
2 from matplotlib import pyplot as plt

讀取數據

不管是哪一種圖表方式,第一步都是先讀取數據,本次讀取數據主要通過pandas進行數據處理,如下所示:

1 # pandas 讀取Excel,默認返回DataFrame類型,<class 'pandas.core.frame.DataFrame'>,屬於二維列表
2 data = pd.read_excel('test.xls', sheet_name=0)
3 # print(type(data))
4 # print(data)

數據讀取到內存中,是一個二維列表,數據類型為pandas.core.frame.DataFrame,是pandas中的數據類型,如下所示:

折線圖

Matplotlib主要通過plot方法繪制折線圖,如下所示:

 1 plt.rcParams['font.family'] = ['sans-serif']
 2 plt.rcParams['font.sans-serif'] = ['SimHei']
 3 figure = plt.figure(figsize=(12, 6))
 4 plt.title('銷售額對比圖')  # 標題
 5 x = data['月份']  # x為一維列表,數據類型: <class 'pandas.core.series.Series'>
 6 y1 = data['張三']  # 張三銷售額
 7 y2 = data['李四']  # 李四銷售額
 8 # print(type(x))
 9 plt.plot(x,y1) # 基礎折線圖,采用描點連線的方式繪制
10 plt.plot(x,y2)
11 plt.show()  # 彈出框展示

簡單設置后,生成的折線圖,如下所示:

通過上圖可以看出兩位實習生的銷售額趨勢,孰優孰劣,但是上圖略顯粗糙,有一些地方表達差強人意,如:x軸,y軸的說明,兩條線分別代表什么,需要更加細致的設置,如下所示:

 1 plt.rcParams['font.family'] = ['sans-serif']
 2 plt.rcParams['font.sans-serif'] = ['SimHei']
 3 figure = plt.figure(figsize=(12, 6))
 4 plt.title('銷售額對比圖')
 5 x = data['月份']  # x為一維列表,數據類型: <class 'pandas.core.series.Series'>
 6 y1 = data['張三']  # 張三銷售額
 7 y2 = data['李四']  # 李四銷售額
 8 # print(type(x))
 9 plt.xlabel('月份')  # x軸說明
10 plt.ylabel('銷售額')  # y軸說明
11 plt.xticks(x, ['%d月' % i for i in range(1, 13)])  # 采用列表推導式生成數組
12 
13 # label 表示線的標簽 color 表示線條的顏色,linestyle表示線條樣式,marker表示點的樣式
14 plt.plot(x,y1,label='張三',color='red',linestyle='--',marker='*')
15 plt.plot(x,y2,label='李四',color='green',linestyle='-.',marker='o')

 16 plt.legend()

17 plt.show() # 彈出框展示

經過細致設置后,兩位實習生的對比結果,如下所示:

折線注意事項

關於示例中marker的設置,如下所示:

 1         **Markers**
 2 
 3         =============   ===============================
 4         character       description
 5         =============   ===============================
 6         ``'.'``         point marker
 7         ``','``         pixel marker
 8         ``'o'``         circle marker
 9         ``'v'``         triangle_down marker
10         ``'^'``         triangle_up marker
11         ``'<'``         triangle_left marker
12         ``'>'``         triangle_right marker
13         ``'1'``         tri_down marker
14         ``'2'``         tri_up marker
15         ``'3'``         tri_left marker
16         ``'4'``         tri_right marker
17         ``'8'``         octagon marker
18         ``'s'``         square marker
19         ``'p'``         pentagon marker
20         ``'P'``         plus (filled) marker
21         ``'*'``         star marker
22         ``'h'``         hexagon1 marker
23         ``'H'``         hexagon2 marker
24         ``'+'``         plus marker
25         ``'x'``         x marker
26         ``'X'``         x (filled) marker
27         ``'D'``         diamond marker
28         ``'d'``         thin_diamond marker
29         ``'|'``         vline marker
30         ``'_'``         hline marker
31         =============   ===============================

關於示例的linestyle設置,如下所示:

 1         **Line Styles**
 2 
 3         =============    ===============================
 4         character        description
 5         =============    ===============================
 6         ``'-'``          solid line style
 7         ``'--'``         dashed line style
 8         ``'-.'``         dash-dot line style
 9         ``':'``          dotted line style
10         =============    ===============================

 

柱狀圖

如果通過折線圖,還不能決定孰優孰劣,那么下面再以柱狀圖的形式來分析,如下所示:

 1 plt.rcParams['font.family'] = ['sans-serif']
 2 plt.rcParams['font.sans-serif'] = ['SimHei']
 3 figure = plt.figure(figsize=(12, 6))
 4 plt.title('銷售額對比圖')
 5 x = data['月份']  # x為一維列表,數據類型: <class 'pandas.core.series.Series'>
 6 y1 = data['張三']  # 張三銷售額
 7 y2 = data['李四']  # 李四銷售額
 8 plt.bar(x,y1) # 默認柱狀圖,兩根柱子會重疊
 9 plt.bar(x,y2)
10 plt.legend()
11 plt.show()  # 彈出框展示

經過上述設置后,初步柱狀圖如下所示:

通過上圖可以看出兩位實習生的銷售額對比,孰優孰劣,但是同樣上圖略顯粗糙,有一些地方表達差強人意,如:x軸,y軸的說明,兩根柱子分別代表什么,以及先繪制的圖的值比較小時,會被覆蓋,需要更加細致的設置,如下所示:

 1 plt.rcParams['font.family'] = ['sans-serif']
 2 plt.rcParams['font.sans-serif'] = ['SimHei']
 3 figure = plt.figure(figsize=(12, 6))
 4 plt.title('銷售額對比圖')
 5 x = data['月份']  # x為一維列表,數據類型: <class 'pandas.core.series.Series'>
 6 y1 = data['張三']  # 張三銷售額
 7 y2 = data['李四']  # 李四銷售額
 8 
 9 plt.xlabel('月份')  # x軸說明
10 plt.ylabel('銷售額')  # y軸說明
11 plt.xticks(x, ['%d月' % i for i in range(1, 13)])  # 采用列表推導式生成數組
12 w = 0.4  # 柱子的寬度,默認為1,這里改為0.5
13 plt.bar((x - w / 2), y1, width=w, label='張三')
14 plt.bar((x + w / 2), y2, width=w, label='李四')
15 # 顯示文本
16 for i in range(0, 12):
17     plt.text(x=x[i] - w / 2, y=y1[i] + 5, s=y1[i], ha='center', va='center')
18     plt.text(x=x[i] + w / 2, y=y2[i] + 5, s=y2[i], ha='center', va='center')
19 plt.legend()
20 
21 plt.show()  # 彈出框展示

經過細致設置后,兩位實習生的對比結果,如下所示:

備注

相信如果將兩張圖展示給領導看,公司領導會很快做出決定【前提是兩位實習生背景簡單,都是憑實力吃飯的非關系戶】。關於Matplotlib的應用還有很多場景,本文旨在拋磚引玉,希望大家都能在工作生活中一帆風順,事事如意。一首小詩,邀君共享。

《竹里館》

【唐】王維

獨坐幽篁里,彈琴復長嘯。
深林人不知,明月來相照。 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM