Pandas的可視化操作(利用pandas得到圖表)


基本折線圖

  Series和DataFrame上的這個功能只是使用matplotlib庫的plot()方法的簡單包裝實現。

舉個例子

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

df = pd.DataFrame(np.random.randn(10,4),index=pd.date_range('2018/12/18',
   periods=10), columns=list('ABCD'))
df.plot()
plt.show()

  

  如果索引由日期組成,則調用gct().autofmt_xdate()來格式化x軸,如上圖所示。

  我們可以使用x和y關鍵字繪制一列與另一列。

  繪圖方法允許除默認線圖之外的少數繪圖樣式。 這些方法可以作為plot()的kind關鍵字參數提供。

主要參數有

  • bar或barh為條形
  • hist為直方圖
  • boxplot為盒型圖
  • area為“面積”
  • scatter為散點圖

 

條形圖

  現在通過創建一個條形圖來看看條形圖是什么。條形圖可以通過以下方式來創建

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d'])
# 使用bar()生成直方圖,barh()生成水平條形圖(要生成一個堆積條形圖,通過指定:pass stacked=True)
df.plot.bar()# 圖1
# df.plot.bar(stacked=True)# 圖2
# df.plot.barh(stacked=True)# 圖3
plt.show()

 

 

直方圖 

  可以使用plot.hist()方法繪制直方圖。我們可以指定bins的數量值。

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

df = pd.DataFrame({'a':np.random.randn(1000)+1,'b':np.random.randn(1000),'c':
np.random.randn(1000) - 1}, columns=['a', 'b', 'c'])

df.plot.hist(bins=20)# 圖1
# 要為每列繪制不同的直方圖,使用以下代碼
df.hist(bins=20)# 圖2(3個小圖)
plt.show()

 

 

箱型圖(類似於k線)

  Boxplot可以繪制調用Series.box.plot()和DataFrame.box.plot()或DataFrame.boxplot()來可視化每列中值的分布。

  例如,這里是一個箱形圖,表示對[0,1)上的統一隨機變量的10次觀察的五次試驗。 

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

df = pd.DataFrame(np.random.rand(10, 5), columns=['A', 'B', 'C', 'D', 'E'])
df.plot.box()
lt.show()

 

區域塊圖形

  可以使用Series.plot.area()或DataFrame.plot.area()方法創建區域圖形。 

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

df = pd.DataFrame(np.random.rand(10, 4), columns=['a', 'b', 'c', 'd'])
df.plot.area()
plt.show()

        

 

散點圖形

  可以使用DataFrame.plot.scatter()方法創建散點圖。

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

df = pd.DataFrame(np.random.rand(50, 4), columns=['a', 'b', 'c', 'd'])
df.plot.scatter(x='a', y='b')
plt.show()

 

餅狀圖

  餅狀圖可以使用DataFrame.plot.pie()方法創建。

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

df = pd.DataFrame(3 * np.random.rand(4), index=['a', 'b', 'c', 'd'], columns=['x'])
df.plot.pie(subplots=True)
plt.show()

 

      


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM