以下為python pandas 庫的dataframe pivot()函數的官方文檔:
Reshape data (produce a “pivot” table) based on column values. Uses unique values from index / columns to form axes of the resulting DataFrame.
譯:重塑數據(產生一個“pivot”表格)以列值為標准。使用來自索引/列的唯一的值(去除重復值)為軸形成dataframe結果。
For finer-tuned control, see hierarchical indexing documentation along with the related stack/unstack methods
譯:為了精細調節控制,可以看和stack/unstack方法有關的分層索引文件.
============================================================================
在數據分析的時候要記得將pivot結果reset_index()。
示例:
import pandas as pd df=pd.read_csv("user_label_part1.csv",sep=',',encoding='gbk') df.head(10) temp=df.pivot(index='user_log_acct',columns='item_third_cate_cd',values='label') temp.to_csv("res.csv",sep=',',encoding='gbk')
df.head(3)
user_log_acct item_third_cate_cd label
0 AA 13691 1
1 BB 898 5
2 CC 898 2
temp.head(3)
item_third_cate_cd 870 878 880 898 1300 13117 13298 13690 13691
user_log_acct
AA NaN NaN NaN NaN NaN NaN NaN NaN 1.0
BB NaN NaN NaN 5.0 NaN NaN NaN NaN NaN
CC NaN NaN NaN 2.0 NaN NaN NaN NaN NaN
這樣可以避免寫 循環去將行轉成列。