panda核心數據結構


Series

Series是一維帶標簽的數組,數組里可以放任意的數據(整數、浮點數、字符串、python Object)等等

創建函數:

  (1)s = pd.Series(data,index=index),其中index是一個列表,用來作為數據的標簽,如果不指定索引,pandas自動分配整形的索引

  (2)字典創建  s = pd.Series(dict,index = list('abcd')),創建的series對象的索引為字典的key 

性質

Series對象的性質:

  類ndarray對象

  類dict對象

  標簽對齊操作

  結論一:series對象可以直接使用ndarray對象方法

 

 

  結論二:series對象可以像python字典對象一樣操作

 

  結論三:標簽對齊,進行操作時,索引自動對應做處理,如果找不到對應值,則為NaN

DateFrame

  DateFrame是二維帶行標簽和列標簽的數組,可以把DateFrame想象成一個Excel表格或一個sql數據庫的表格,還可以想象成一個series對象字典,它是pandas里最常用的數據結構

創建DateFrame對象

df = pd.DateFrame(data,index = index,columns = columns)    其中index是行標簽,columns是列標簽,data可以是下面的數據結構:

  (1)由一維numpy數組,list,Series構成的字典

  (2)二維numpy數組

  (3)另外的DateFrame對象

字典方式創建:

(1)Series對象構成的字典方式創建:

  (2)列表構成的字典方式創建

  注意:由series對象構成的字典,series元素可以不相等,但列表構成的字典,列表元素必須相等,不然會報錯

列表創建

  (1)列表中元素由元組構成

  

  (2)列表中元素由字典構成

 

 從Series創建DataFrame

  注意:series為一維數組,故列索引只能有一列,不然會報錯

性質

  先創建一個數組

 (1)查找

 

(2)賦值

(3)刪除操作

(4)添加

(5)指定刪除並獲取結果

(6)指定位置插入

(7)assign在原來對象基礎上做操作但不會改變原對象數據結構

Panel

Panel是三維帶標簽的數組,Pancel比較少用,但依然是最重要的基礎數據結構之一.

Panel有三個標簽:

  items:坐標軸 0,索引對應的元素是一個DataFrame

  magor_axis:坐標軸1,DataFrame里的行標簽

  minor_axis:坐標軸 2,DataFrame里的列標簽

創建方式:

  查看各維度索引

轉換為DataFrame對象

 

 

 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM