pandas dataframe在指定的位置添加一列, 或者一次性添加幾列,re


  相信有很多人收這個問題的困擾,如果你想一次性在pandas.DataFrame里添加幾列,或者在指定的位置添加一列,都會很苦惱找不到簡便的方法;可以用到的函數有df.reindex, pd.concat

 

我們來看一個例子:

df 是一個DataFrame, 如果你只想在df的后面添加一列,可以用下面的方法:

但是如果你想一次性添加兩列級以上,你可能會用通樣的辦法

df[['D','E']] == None ,結果報錯如下:

 

所以接下來我想介紹兩種認為比較簡便的方法

(1)第一個方法是利用pd.concat 在DataFrame后面添加兩列,這種方法的缺點是不能指定位置

pd.concat([df, pd.DataFrame(columns=list('DE'))])

(2)第二種方法是利用 reindex來重排和增加列名df.reindex(columns=list('ABCDE'))

這種方法,你可以改變各列的相對位置,且保留原始列的數值,比如df.reindex(columns=list('BCADE'))

reindex 還有 fill_value 選項,可以填充NaN,例子如下df.reindex(columns=list('ABCDE'), fill_value=0)

 

  當然這里舉的例子比較簡單,在實際運用中,列名可能都比較長,都敲出來肯定不方便,所以我們需要更強大的方法,運用到 list.insert的方法list.insert(index, obj)

參數
index -- 對象obj需要插入的索引位置。

obj -- 要插入列表中的對象。
先獲取原列名集合, 賦值給新變量(這個很重要,具體原因我也不知道為啥), 然后 insert

 

col_name = df.columns.tolist()
col_name.insert(1,'D')
df.reindex(columns=col_name)
Out[92]: 
A D B C
01 NaNNoneNone
13 NaNNoneNone
 或者不用數字索引,直接在某列前面或后面插入,利用 list.index的方法
col_name = df.columns.tolist()
col_name.insert(col_name.index('B'),'D')# 在 B 列前面插入
df.reindex(columns=col_name)
Out[93]: 
A D B C
01 NaNNoneNone
13 NaNNoneNone
col_name = df.columns.tolist()
col_name.insert(col_name.index('B')+1,'D') # 在 B 列后面插入
df.reindex(columns=col_name)
Out[96]: 
A B D C
01None NaNNone
13None NaNNone

轉自:http://www.th7.cn/Program/Python/201708/1216328.shtml


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM