Pandas :Series、DataFrame 結構的數據創建


一、pandas核心數據結構:Series

理解:Series可以理解為一個一維的數組,只是index可以自己改動。類似於定長的有序字典,有Index和value。
創建的方法統一為:pd.Series(data,index=)         

1)打印的時候按照index賦值的順序

2)index參數默認從0開始的整數,也是Series的絕對位置,即使index被賦值之后,絕對位置不會被覆蓋,index賦值必須是list類型。

Series可以通過以下形式創建:python的dict、umpy當中的ndarray(numpy中的基本數據結構)、具體某個數值。

 

 代碼:

import pandas as pd

# 創建一組Series數據
print(("---------------案例1--------------"))
# 書寫格式1: 列表格式
s1 = pd.Series([90,86,70],index=["Leo","Kate","John"])
print(s1)

# 書寫格式2:字典格式
dict={"leo":90,"kate":86,"john":70}

s2 = pd.Series(dict)
print("s2=","\n",s2)


print(("--------------案例2--------------"))
s3=pd.Series([3,-5,7,4],index=list('ABCD'))
print("s3=","\n",s3)

 

結果圖:

 

 

 

二、pandas核心數據結構:DataFrame

理解:DataFrame是一個類似於表格的數據類型,DataFrame可以理解為一個二維數組,index有兩個維度,可更改。


DataFrame參數:

data (方框內的數據)     :numpy ndarray、dict、 DataFrame
index(行索引索引)        :Index or array-like
columns (列索引)          :Index or array-like
dtype(data的數據類型) :dtype, 默認為 None

DataFrame統一的創建形式為pd.DataFrame(data,columns=,index=)

   其中columns為列的索引,index為行的索引。

   index或者columns如果不進行設置則默認為0開始的整數。

 

 

 代碼:

import pandas as pd

print("---------案例1:--------------")
# 創建DataFrame,列名是:'name'、'gender'、'age'
df = pd.DataFrame([['Snow','M',22],
                   ['Tyrion','M',32],
                   ['Sansa','F',18],
                   ['Arya','F',14]], columns=['name','gender','age'])
print(df)

print("---------案例2:--------------")
# DataFrame創建,列名是:'Country'、'Capital'、'Population'
data=[['Belglum','Brussels',11190846],
      ['Indla','New Delhi',1303171035],
      ['Brazil','Brasilia',207847528]]

# index如果不寫,默認從0開始序列,下面設置了從1開始序列
df1=pd.DataFrame(data=data,index=[1,2,3],columns=['Country','Capital','Population'])
print(df1)

結果圖:

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM