DataFrame.groupby()函數


  • 用二維列表構造原始數據
1 import pandas as pd 2 
3 data = [['li', 'math', 100], ['bob', 'pe', 99], ['sar', 'english', 98], ['li', 'pe', 89]]
  • 將數據轉換成DataFrame類型
1 import pandas as pd 2 
3 dataFrame = pd.DataFrame(dada, columns = ['name', 'course', 'score']) # columns 為列名 並且必須是list類型
  • 打印dataFrame對象

  • 此時不能根據行號索引,但是可以根據列名索引
1 import pandas as pd 2 
3 print(dataFrame[0])

1 import pandas as pd 2 
3 print(dataFrame["name"]) 

  • 此時的dataFrame["name"] 是一個類似於一維數組的series對象,可根據下標索引
1 import pandas as pd 2 
3 print(dataFrame["name"])
4 print(type(dataFrame["name"]))
5 print(dataFrame["name"][0])

 

  • 像字典一樣用索引創建新列 dataFrame["age"]
1 import pandas as pd 2 
3 dataFrame["age"] = [23, 24, 25, 23] 4 print(dataFrame)

 

  • 重點來了,dataFrame.groupby("name")根據name屬性分組,name列數據項默認成為索引
1 import pandas as pd 2 
3 dataFrame = dataFrame.groupby(["name", "course"])["score"].sum() # 可以通過as_index指定分組項要不要成為索引, 默認為True 4 print(dataFrame)
5 print(dataFrame["li"])

 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2026 CODEPRJ.COM