1、為什么要學習pandas
numpy已經能夠幫助我們處理數據,能夠結合matplotlib解決我們數據分析的問題,那么pandas學習的目的在什么地方呢?
numpy能夠幫我們處理處理數值型數據,但是這還不夠, 很多時候,我們的數據除了數值之外,還有字符串,還有時間序列等
比如:我們通過爬蟲獲取到了存儲在數據庫中的數據
所以,pandas出現了。
2、什么是pandas?
Pandas的名稱來自於面板數據(panel data)
Pandas是一個強大的分析結構化數據的工具集,基於NumPy構建,提供了高級數據結構和數據操作工具,它是使Python成為強大而高效的數據分析環境的重要因素之一。
- 一個強大的分析和操作大型結構化數據集所需的工具集
- 基礎是NumPy,提供了高性能矩陣的運算
- 提供了大量能夠快速便捷地處理數據的函數和方法
- 應用於數據挖掘,數據分析
- 提供數據清洗功能
(可以把pandas理解成一個數據處理的工具箱)
官網: