Pandas之Dataframe疊加，排序，統計，重新設置索引

本文轉載自查看原文 2018-09-20 15:59 2733 Python

Pandas之Dataframe索引，排序，統計，重新設置索引

一：疊加

import pandas as pd

a_list = [df1,df2,df3]
add_data = pd.concat(a_list,ignore_index = True)

其中的ignore_index參數代表是否重新建立索引。

如果df比較多，可以采用如下方法建立a_list

a_list = []
for i in range(len(df)）:
     a_list.append(df[i])

二：排序

df.sort_values(by=["B","A"] , ascending=(False,False))

df.sort_values(by=["A","B"] , ascending=(False,False))

這兩個表達式結果不一樣，第一個是先按B排的基礎上，當B一樣時再按A排，第二個是先按照A排完再按B排。

其中ascending默認是FALSE，即默認會按照相應的by中的第幾個元素降序排序，當希望用第幾個元素升序排序時，可以設置成TRUE

三：統計

df["A"].value_counts()#對A列進行統計，計數然后生成一個只有一個A值和對應計數值。

這個是統計A列中的唯一值有多少。

如果統計多列的計數值，可以采用如下方法

 1 a = [["None" for col in range(3)] for row in
 2 range(len(df["A"]*len(df["B"])
 3 k = 0
 4 for i in range(len(df["A"]):
 5     for j in range(len(df["B"]):
 6         a[k][0] = df.A[i]
 7         a[k][1] = df.B[j]
 8         data_select = df[df.A==x[i]&df.B==x[j]]
 9         a[k][2] = len(data_select)
10

View Code

df["A"].unique()

這個會直接取出A列中的唯一值

四、重新設置索引

df = df.reset_index(drop = True)

重新設置行索引

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 pandas.dataframe重新設置索引，某字段排序，刪除指定行 DataFrame 重新設置索引: reindex 和 reset_index 的區別 DataFrame 重新設置索引: reindex 和 reset_index 的區別按索引和值對Pandas DataFrame進行排序 pandas中DataFrame重置設置索引 python pandas DataFrame 清除非數字類型、重新索引 jqgrid 重新設置setGridParam MySQL重新設置密碼 linux 重新設置mysql密碼 Linux下重新設置 MySQL 的密碼