Pandas:DataFrame數據選擇方法(索引)


#首先創建我們的Series對象,然后合並到dataframe對象里面去
import pandas as pd
import numpy as np
area=pd.Series({'ChongQing':188888,'BeiJing':92387928,'Shanghai':8374583746,'Sydney':82734})
population=pd.Series({'ChongQing':1000,'BeiJing':2000,'Shanghai':2900,'Sydney':3000})
data=pd.DataFrame({'area':area,'population':population})#備注:創建字典的結構時一定要遵循字典的數據結構
#也就是創建完字典之后一定要在字典的前后寫上花括號,這個是一個很重要的習慣
print(data)

輸出結果:

                 area        population
ChongQing      188888        1000
BeiJing      92387928        2000
Shanghai   8374583746        2900
Sydney          82734        3000

輸入代碼增加我們colums上的對象:

data['area']

輸出:

ChongQing        188888
BeiJing        92387928
Shanghai     8374583746
Sydney            82734
Name: area, dtype: int64

輸入:

#利用屬性的形式來列出一個columns的數據,上面是使用了索引的形式,這種形式並不太常用
data.area

輸出:

ChongQing        188888
BeiJing        92387928
Shanghai     8374583746
Sydney            82734
Name: area, dtype: int64

輸入:

data.values#其實dataframe是一個十分顯然的二維數組,我們可以用這個公式來驗證它

輸出:

array([[1.88888000e+05, 1.00000000e+03, 1.88888000e+02],
       [9.23879280e+07, 2.00000000e+03, 4.61939640e+04],
       [8.37458375e+09, 2.90000000e+03, 2.88778750e+06],
       [8.27340000e+04, 3.00000000e+03, 2.75780000e+01]])

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM