python dataframe rename_詳解pandas DataFrame修改行列名


在做WISE數據處理時,有時候需要將幾組數據生成一個DataFrame,然而在生成的過程中我一般不會設置列的名字(因為這種過程可能會有很多步),所以最后的列名是默認的。為了方便自己以后讀代碼,還是希望最后已處理好的數據有相應的數據相關列名。

自己在網上也查了了一些人的解決辦法,感覺沒有一個能講明白,現將自己的理解總結如下。

方法1:修改DataFrame的columns或index屬性值

DataFrame屬性鏈接:DataFrame。現在我們知道,對於每一個DataFrame都有index和columns兩個屬性,這兩個屬性給出了Dataframe的

math?formula=%5Ccolor%7Bred%7D%7B%E7%B4%A2%E5%BC%95%7D和

math?formula=%5Ccolor%7Bred%7D%7B%E5%88%97%7D的信息。所以我們可以對DataFrame的index或columns屬性信息重新賦值,以達到對行或者列重新命名。

math?formula=%5Ccolor%7Bred%7D%7B%E6%B3%A8%7D:這種方法是一次性將所有的行 or 列重新命名,不能僅對單個或幾個行 or 列重新命名,因為DataFrame的index或columns屬性值是不可更改的(即:可以將index屬性值整體賦值,但不能對單個或者幾個賦值)。

import numpy as np

import pandas as pd

df = pd.DataFrame({undefined

'col1':['a','a','b',np.nan,'c'],

'col2':[2, 1, 8, 7, 6],

'col3':[0, 4, 7, 2, 3],

})

df

col1 col2 col3

0 a 2 0

1 a 1 4

2 b 8 7

3 NaN 7 2

4 c 6 3

#修改行標簽

df.columns

Index(['col1', 'col2', 'col3'], dtype='object')

df.columns = ['a','b','c']

df

a b c

0 a 2 0

1 a 1 4

2 b 8 7

3 NaN 7 2

4 c 6 3

#修改列標簽

df.index = ['a0','a1','a2','a3','a4']

df

col1 col2 col3

a0 a 2 0

a1 a 1 4

a2 b 8 7

a3 NaN 7 2

a4 c 6 3

方法2:pandas.DataFrame.rename()函數

rename函數是專門為了修改DataFrame坐標軸標簽函數。rename函數的優點:可以

math?formula=%5Ccolor%7Bred%7D%7B%E9%80%89%E6%8B%A9%E6%80%A7%E7%9A%84%E4%BF%AE%E6%94%B9%7D某行某列的標簽。

math?formula=%5Ccolor%7Bred%7D%7B%E6%B3%A8%7D:函數/字典中的值必須是唯一的(1對1)。 未包含在字典/Series中的標簽將保留原樣。 列出的額外標簽不會引發錯誤。

DataFrame.rename(self, mapper=None, index=None, columns=None, axis=None, copy=True, inplace=False, level=None, errors='ignore')

參數介紹:

參數

含義

mapper

映射結構,修改columns或index要傳入一個映射體,可以是字典、函數。修改列標簽跟columns參數一起;修改行標簽跟index參數一起。

index

行標簽參數,mapper, axis=0 等價於 index=mapper

columns

列標簽參數,mapper, axis=1 等價於 columns=mapper

axis

軸標簽格式,0代表index,1代表columns,默認index

copy

默認為True,賦值軸標簽后面的數據

inplace

默認為False,不在原處修改數據,返回一個新的DataFrame

level

默認為None,處理單個軸標簽(有的數據會有2個或多個index或columns)

errors

默認ignore,如果映射體里面包含DataFrame沒有的軸標簽,忽略不報錯

例子:

df = pd.DataFrame({"A": [1, 2, 3], "B": [4, 5, 6]})

df.rename(columns={"A": "a", "B": "c"})

a c

0 1 4

1 2 5

2 3 6

df.rename(index={0: "x", 1: "y", 2: "z"})

A B

x 1 4

y 2 5

z 3 6

df.rename(str.lower, axis='columns')

a b

0 1 4

1 2 5

2 3 6

df.rename({1: 2, 2: 4}, axis='index')

A B

0 1 4

2 2 5

4 3 6


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM