Python实现行转列

本文转载自查看原文 2021-10-11 23:04 1145 python操作wps

数据的行转列操作，在实际工作过程中应用非常广泛。
由于不同人员、不同部门对数据结构的认识是不大相同的，尤其是从基层人员手里拿到的数据，更是五花八门，横七竖八。
比如有这样一张成绩表：

需求：=简单计算一下每个人的总分吧！

安排

# 遇事不要慌，先导个包吧
import pandas as pd
import numpy as np

# 造假数据
data = {'name':['严小样儿','严小样儿','严小样儿','才华横竖都溢','才华横竖都溢','才华横竖都溢','幽兰幽香','幽兰幽香','幽兰幽香'],
       'subject':['Python','C','SQL','Python','C','SQL','Python','C','SQL'],
       'score':[95,60,95,96,95,80,99,94,88]}

# 生成df
df = pd.DataFrame(data)
df

使用pivot方法即可完成行转列哦~语法如下：

#df.pivot(index=None, columns=None, values=None)
df.pivot(index='name',columns='subject',values='score')

不要高兴的太早，遇到重复值就麻烦了！少侠请看：

# 造含有重复值的假数据
data1 = {'name':['严小样儿','严小样儿','严小样儿','严小样儿','才华横竖都溢','才华横竖都溢','才华横竖都溢','幽兰幽香','幽兰幽香','幽兰幽香'],
       'subject':['Python','Python','C','SQL','Python','C','SQL','Python','C','SQL'],
       'score':[95,95,60,95,96,95,80,99,94,88]}

df1 = pd.DataFrame(data1)
df1

df1.pivot(index='name',columns='subject',values='score')

# 一旦有重复值，就会报错。
ValueError: Index contains duplicate entries, cannot reshape

别急别急，去个重不就可以了吗？！

df1.drop_duplicates().pivot(index='name',columns='subject',values='score')

方法二：数据透视表

# pivot_table(data, values=None, index=None, columns=None, aggfunc='mean')
pd.pivot_table(df1,index='name',columns='subject',values='score',aggfunc={'score':'max'})

聚合

刚刚说了，要求每个人的总分，其实使用透视表就可以完成。
不过，稍微动动脑筋哦。遇到重复值数据的话，只能使用下面的方法一，去重后的数据集，方法一，二都支持。
计算每个人的总分，语法如下：

# 重复数据集也可以
df_pivot = pd.pivot_table(df1,index='name',columns='subject',values='score',aggfunc={'score':'max'})
# 增加一个新列：Total
df_pivot['Total'] = df_pivot.apply(lambda x:np.sum(x),axis = 1)
df_pivot

方法二，必须是去重后的数据集，否则会出现计算错误。

# 使用去重数据集才可以
pd.pivot_table(df,index='name',values='score',aggfunc='sum')

# 使用join方法把总分列加进去。
total = pd.pivot_table(df,index='name',values='score',aggfunc='sum')
pd.pivot_table(df,index='name',columns='subject',values='score').join(total)

--需求方：算是算出来了，可是，这个score看着怪怪的，能不能改成“总分”呢？
--严小样儿：我改（卑微）！安排~

total1 = pd.pivot_table(df,index='name',values='score',aggfunc='sum').rename({'score':'总分'},axis=1)
pd.pivot_table(df,index='name',columns='subject',values='score').join(total1)

行转列，就这样讲完了，大家赶快动手实践一下吧。那么，如何列转行呢？！

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 Spark：实现行转列 sql实现行转列 mysql实现行转列功能 vertica sql实现行转列 Oracle实现行转列+Mybatis Sql语句实现行转列 PIVOT内置函数实现行转列 oracle 动态实现行转列操作 List,DataTable实现行转列的通用方案巧妙使用excel 实现行转列