選擇某些列
import pandas as pd # 從Excel中讀取數據,生成DataFrame數據 # 導入Excel路徑和sheet name df = pd.read_excel(excelName, sheet_name=sheetName) # 讀取某些列,生成新的DataFrame newDf = pd.DataFrame(df, columns=[column1, column2, column3])
選擇某些列和行
# 讀取某些列,並根據某個列的值篩選行 newDf = pd.DataFrame(df, columns=[column1, column2, column3])[(df.column1 == value1) & (df.column2 == value2)]
添加新的列
# 第一種直接賦值 df["newColumn"] = newValue # 第二種用concat組合兩個DataFrame pd.concat([oldDf, newDf])
更改某一列的值
# 第一種,replace df["column1"] = df["column1"].replace(oldValue, newValue) # 第二種,map df["column1"] = df["column1"].map({oldValue: newValue}) # 第三種,loc # 將column2 中某些行(通過column1中的value1來過濾出來的)的值為value2 df.loc[df["column1"] == value1, "column2"] = value2
補全缺失值
# fillna填充缺失值 df["column1"] = df["column1"].fillna(value1)