Series
Series是一維帶標簽的數組,數組里可以放任意的數據(整數、浮點數、字符串、python Object)等等
創建函數:
(1)s = pd.Series(data,index=index),其中index是一個列表,用來作為數據的標簽,如果不指定索引,pandas自動分配整形的索引
(2)字典創建 s = pd.Series(dict,index = list('abcd')),創建的series對象的索引為字典的key
性質
Series對象的性質:
類ndarray對象
類dict對象
標簽對齊操作
結論一:series對象可以直接使用ndarray對象方法
結論二:series對象可以像python字典對象一樣操作
結論三:標簽對齊,進行操作時,索引自動對應做處理,如果找不到對應值,則為NaN
DateFrame
DateFrame是二維帶行標簽和列標簽的數組,可以把DateFrame想象成一個Excel表格或一個sql數據庫的表格,還可以想象成一個series對象字典,它是pandas里最常用的數據結構
創建DateFrame對象
df = pd.DateFrame(data,index = index,columns = columns) 其中index是行標簽,columns是列標簽,data可以是下面的數據結構:
(1)由一維numpy數組,list,Series構成的字典
(2)二維numpy數組
(3)另外的DateFrame對象
字典方式創建:
(1)Series對象構成的字典方式創建:
(2)列表構成的字典方式創建
注意:由series對象構成的字典,series元素可以不相等,但列表構成的字典,列表元素必須相等,不然會報錯
列表創建
(1)列表中元素由元組構成
(2)列表中元素由字典構成
從Series創建DataFrame
注意:series為一維數組,故列索引只能有一列,不然會報錯
性質
先創建一個數組
(1)查找
(2)賦值
(3)刪除操作
(4)添加
(5)指定刪除並獲取結果
(6)指定位置插入
(7)assign在原來對象基礎上做操作但不會改變原對象數據結構
Panel
Panel是三維帶標簽的數組,Pancel比較少用,但依然是最重要的基礎數據結構之一.
Panel有三個標簽:
items:坐標軸 0,索引對應的元素是一個DataFrame
magor_axis:坐標軸1,DataFrame里的行標簽
minor_axis:坐標軸 2,DataFrame里的列標簽
創建方式:
查看各維度索引
轉換為DataFrame對象