復合列名不好引用,我們想重新命名,假如有如下表:
我們直接使用重命名
card_state_nouse = card_state_nouse.rename(columns={('ref_id', 'count'):'weijihuo_count',('creditlimitamount', 'sum'):'weijihuo_amount',\ ('card_month', 'max'):'weijihuo_minmonth',('card_month', 'min'):'weijihuo_maxmonth' },errors='raise')
發現結果還是
經百度可以這樣
card_state_nouse.columns = card_state_nouse.columns.to_flat_index() #然后再跑這段 card_state_nouse = card_state_nouse.rename(columns={('ref_id', 'count'):'weijihuo_count',('creditlimitamount', 'sum'):'weijihuo_amount',\ ('card_month', 'max'):'weijihuo_minmonth',('card_month', 'min'):'weijihuo_maxmonth' },errors='raise')
結果OK
但是我們也可以直接這樣
card_state_nouse.columns = ['weijihuo_count','weijihuo_amount','weijihuo_minmonth','weijihuo_maxmonth']
如果我們想使用原來的拼接的列名,則可以這樣
table_cnt.columns = [('_'.join(col).rstrip('_'))+'_cnt' for col in table_cnt.columns.values]
總結:
我們既可以使用rename,也可以使用columns=[],這二者的區別是,前者可以只修改某個列名,二后者必須給出全部的列名,當列名很多時候,前者就很有價值
還需要主要一下to_flat_index 的用法
2021.02.22補充
def flatten_multi_index(multi_index, join_str='_'): """把 MultiIndex 展平為 1 維。返回一維 Index 參數: ----------- multi_index: MultiIndex 對象 join_str: str, 連接第一層和第二層 label 的字符串 返回: ----------- index: 展平后的 index 對象。""" label0 = multi_index.get_level_values(0) label1 = multi_index.get_level_values(1) index = [i + join_str + j for i,j in zip(label0, label1)] return pd.Index(index)