數據分析入門——pandas之DataFrame多層/多級索引與聚合操作


一、行多層索引

  1.隱式創建

    在構造函數中給index、colunms等多個數組實現(datafarme與series都可以)

    

    df的多級索引創建方法類似:

    

    2.顯式創建pd.MultiIndex

      其中.from_arrays為類似上面的參數,推薦使用簡單的from_product函數(會自動進行交叉):

      

二、列多層索引

  列多層索引同理:

  

 三、多層索引操作與切片

  1.Series多層索引

    使用中括號和loc效果完全一樣:

    

    切片,只切第一級索引,與之前一致,需要指定某些指定行時,可以通過iloc切片,最后一級索引來切片:

    

    2.dataframe的索引與切片

    直接切與series類似,只切最外層索引:(包含中文時,可能會有bug!屬於Pandas的bug)

    

    使用Loc函數查找:

    

  更多多級索引的操作,參考https://www.jianshu.com/p/760cd4f46c8d

 四、索引的stack堆——重排

  堆,字面意思就是摞起來的意思,調用stack就會將數據摞起來:

  

  在pandas里面,這個叫重排,參考https://blog.csdn.net/S_o_l_o_n/article/details/80917211

五、聚合操作

  1.sum()

    可以通過axis來控制行還是列,通過之前對軸的介紹,知道axis = 0的默認值是逐行:

    

  2.其他的聚合:max,min等同理:

    

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM