pandas.DataFrame的groupby()方法的基本使用

本文轉載自查看原文 2019-10-03 21:52 4164

pandas.DataFrame的groupby()方法是一個特別常用和有用的方法。讓我們快速掌握groupby()方法的基礎使用，從此數據分析又多一法寶。

首先導入package：

import pandas as pd
import numpy as np

groupby的最基本操作

df = pd.DataFrame({'A':[1,2,3,1],'B':[2,3,3,6],'C':[3,1,5,7]})
df

按照A列來進行分組（其實說白了就是將A列中重復的值和成同一個值，然后把A當成索引來進行重新的數據分組）

df.groupby('A').mean() #mean是取平均值

df.groupby('A').sum() #sum是求和

df.groupby(['A']).first() #取第一個出現的數據

df.groupby(['A']).last() #取最后一個出現的數據

也可以按照多組進行分組

df.groupby(['A','B']).sum()

統計數據的數量

size跟count的區別： size計數時包含NaN值，而count不包含NaN值

df = pd.DataFrame({'A':[1,2,3,1],'B':[2,3,3,6],'C':[3,np.nan,5,7]})
df

df.groupby(['A']).count()

df.groupby(['A']).size()

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 pandas.DataFrame 索引方法區別 pandas.DataFrame排除特定行 pandas.DataFrame對行和列求和及添加新行和列 Python pandas.DataFrame調整列順序及修改index名 Pandas的排序和排名（Series， DataFrame） + groupby pandas：對dataframe進行groupby后求眾數mode pandas.DataFrame——pd數據框的簡單認識、存csv文件 pandas groupby Python pandas.DataFrame.pipe函數方法的使用 Python pandas.DataFrame.get_values函數方法的使用