python.pandas groupby根据最小值更改某列数据


根据outid列和course_no列对数据进行group_by然后count

想要获得count=3的分组中 score的最小值

并根据score最小值所在的行去修改另外一列

df2 = df.groupby(by=['outid','course_no'],as_index=False).count()
a=df2[df2['id']>2]
c= DataFrame(list(zip(a['outid'],a['course_no'])))
c.columns=['outid','course_no']
b=pd.merge(c,df,on=['outid','course_no'])
e=b.groupby(['outid','course_no'],as_index=False).apply(lambda t: t[t.score==t.score.min()])
g=list(e['id'])
for i in  g:
    df.loc[df['id']==i,'exam_natures_new']=4

思路是先筛选出count>2的outid和course_no

然后和原先的dataframe取交集

对交集再进行group by 取最小值

获得最小值的的id

将id放入list

遍历list改变原dataframe


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM