python pivot() 函數


以下為python pandas 庫的dataframe pivot()函數的官方文檔:

 

Reshape data (produce a “pivot” table) based on column values. Uses unique values from index / columns to form axes of the resulting DataFrame. 
譯:重塑數據(產生一個“pivot”表格)以列值為標准。使用來自索引/列的唯一的值(去除重復值)為軸形成dataframe結果。

For finer-tuned control, see hierarchical indexing documentation along with the related stack/unstack methods 
譯:為了精細調節控制,可以看和stack/unstack方法有關的分層索引文件. 
============================================================================ 
在數據分析的時候要記得將pivot結果reset_index()。

 

示例:

import pandas as pd
df=pd.read_csv("user_label_part1.csv",sep=',',encoding='gbk')
df.head(10)
temp=df.pivot(index='user_log_acct',columns='item_third_cate_cd',values='label')
temp.to_csv("res.csv",sep=',',encoding='gbk')
df.head(3)

user_log_acct item_third_cate_cd label
0 AA 13691 1
1 BB 898 5
2 CC 898 2

temp.head(3)

item_third_cate_cd 870 878 880 898 1300 13117 13298 13690 13691
user_log_acct
AA NaN NaN NaN NaN NaN NaN NaN NaN 1.0
BB NaN NaN NaN 5.0 NaN NaN NaN NaN NaN
CC NaN NaN NaN 2.0 NaN NaN NaN NaN NaN

 

這樣可以避免寫  循環去將行轉成列。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM