利用Python進行數據分析(7) pandas基礎: Series和DataFrame的簡單介紹



一、pandas 是什么

pandas 是基於 NumPy 的一個 Python 數據分析包,主要目的是為了 數據分析。它提供了大量高級的 數據結構對數據處理的方法。
pandas 有兩個主要的數據結構: Series DataFrame

二、Series

Series 是一個 一維數組對象 ,類似於 NumPy 的一維 array。它除了包含一組數據還包含一組索引,所以可以把它理解為一組帶索引的數組。

將 Python 數組轉換成 Series 對象:

將 Python 字典轉換成 Series 對象:

當沒有顯示指定索引的時候,Series 自動以 0 開始,步長為 1 為數據創建索引。
你也可以通過 index 參數顯示指定索引:

對於 Series 對象里的單個數據來說,和普通數組一樣,根據索引獲取對應的數據或重新賦值;
不過你還可以傳入一個索引的數組來獲取數據或未數據重新賦值:

想要單獨獲取 Series 對象的索引或者數組內容的時候,可以使用 index values 屬性,例如:

對 Series 對象的運算(索引不變):

三、DataFrame

DataFrame 是一個 表格型的數據結構。它提供 有序的列不同類型的列值
例如將一個由 NumPy 數組組成的字典轉換成 DataFrame 對象:

DataFrame 默認根據列名首字母順序進行排序,想要指定列的順序?傳入一個列名的字典即可:

如果傳入的列名找不到,它不會報錯,而是產生一列 NA 值:

DataFrame 不僅可以以字典索引的方式獲取數據,還可以以屬性的方法獲取,例如:

修改列的值:
 
 
刪除某一列:

安裝步驟已經在首篇隨筆里寫過了,這里不在贅述。 利用Python進行數據分析(1) 簡單介紹
接下來一篇隨筆內容是:利用Python進行數據分析(8) pandas基礎: Series和DataFrame的基本操作,有興趣的朋友歡迎關注本博客,也歡迎大家添加評論進行討論。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM