基本折線圖
Series和DataFrame上的這個功能只是使用matplotlib庫的plot()方法的簡單包裝實現。
舉個例子
import pandas as pd import numpy as np import matplotlib.pyplot as plt df = pd.DataFrame(np.random.randn(10,4),index=pd.date_range('2018/12/18', periods=10), columns=list('ABCD')) df.plot() plt.show()
如果索引由日期組成,則調用gct().autofmt_xdate()來格式化x軸,如上圖所示。
我們可以使用x和y關鍵字繪制一列與另一列。
繪圖方法允許除默認線圖之外的少數繪圖樣式。 這些方法可以作為plot()的kind關鍵字參數提供。
主要參數有
- bar或barh為條形
- hist為直方圖
- boxplot為盒型圖
- area為“面積”
- scatter為散點圖
條形圖
現在通過創建一個條形圖來看看條形圖是什么。條形圖可以通過以下方式來創建
import pandas as pd import numpy as np import matplotlib.pyplot as plt df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d']) # 使用bar()生成直方圖,barh()生成水平條形圖(要生成一個堆積條形圖,通過指定:pass stacked=True) df.plot.bar()# 圖1 # df.plot.bar(stacked=True)# 圖2 # df.plot.barh(stacked=True)# 圖3 plt.show()
直方圖
可以使用plot.hist()方法繪制直方圖。我們可以指定bins的數量值。
import pandas as pd import numpy as np import matplotlib.pyplot as plt df = pd.DataFrame({'a':np.random.randn(1000)+1,'b':np.random.randn(1000),'c': np.random.randn(1000) - 1}, columns=['a', 'b', 'c']) df.plot.hist(bins=20)# 圖1 # 要為每列繪制不同的直方圖,使用以下代碼 df.hist(bins=20)# 圖2(3個小圖) plt.show()
箱型圖(類似於k線)
Boxplot可以繪制調用Series.box.plot()和DataFrame.box.plot()或DataFrame.boxplot()來可視化每列中值的分布。
例如,這里是一個箱形圖,表示對[0,1)上的統一隨機變量的10次觀察的五次試驗。
import pandas as pd import numpy as np import matplotlib.pyplot as plt df = pd.DataFrame(np.random.rand(10, 5), columns=['A', 'B', 'C', 'D', 'E']) df.plot.box() lt.show()
區域塊圖形
可以使用Series.plot.area()或DataFrame.plot.area()方法創建區域圖形。
import pandas as pd import numpy as np import matplotlib.pyplot as plt df = pd.DataFrame(np.random.rand(10, 4), columns=['a', 'b', 'c', 'd']) df.plot.area() plt.show()
散點圖形
可以使用DataFrame.plot.scatter()方法創建散點圖。
import pandas as pd import numpy as np import matplotlib.pyplot as plt df = pd.DataFrame(np.random.rand(50, 4), columns=['a', 'b', 'c', 'd']) df.plot.scatter(x='a', y='b') plt.show()
餅狀圖
餅狀圖可以使用DataFrame.plot.pie()方法創建。
import pandas as pd import numpy as np import matplotlib.pyplot as plt df = pd.DataFrame(3 * np.random.rand(4), index=['a', 'b', 'c', 'd'], columns=['x']) df.plot.pie(subplots=True) plt.show()