參考:https://blog.csdn.net/cjsyr6wt/article/details/78200444?locationNum=11&fps=1
以下是pandas官方的解釋:
DataFrame.groupby(by = None,axis = 0,level = None,as_index = True,sort = True,group_keys = True,squeeze = False,observe = False,** kwargs )
as_index : bool,默認為True
對於聚合輸出,返回以組標簽作為索引的對象。僅與DataFrame輸入相關。as_index = False實際上是“SQL風格”的分組輸出。
import pandas as pd df = pd.DataFrame(data={'books':['bk1','bk1','bk1','bk2','bk2','bk3'], 'price': [12,12,12,15,15,17],'num':[2,1,1,4,2,2]}) print('df')
我們來看一下輸出:

看一下as_index為True的輸出:
1 print(df.groupby('books',as_index=True).sum())

看以下as_index為False的輸出:
1 print(df.groupby('books',as_index=False).sum())

可以看到為True時 自動把第一列作為了index
as_index為True時可以通過book的name來提取這本書的信息,如:
1 df = df.groupby('books',as_index=True).sum() 2 print(df) 3 print('='*20) 4 print(df.loc['bk1'])
輸出為:

具體的作用就是這樣了吧,有不同見解的可以分享一下~
