pandas常用操作詳解——排序函數sort_values()和sort_index()


 

sort_values(by=None)函數介紹:

 

功能:以dataframe中的數據值為依據進行排序

參數解釋:by為一個列表,列表中的元素為排序所參考列的列名;當列表中有多個元素時,dataframe按照元素順序依次進行排序

 

舉例說明:

 

import pandas as pd
import numpy as np

#構建數據
boolean=[True,False]
gender=["",""]
color=["white","black","yellow"]
df1=pd.DataFrame({
    "height":np.random.randint(150,190,100),
    "weight":np.random.randint(40,90,100),
    "smoker":[boolean[x] for x in np.random.randint(0,2,100)],
    "gender":[gender[x] for x in np.random.randint(0,2,100)],
    "age":np.random.randint(15,90,100),
    "color":[color[x] for x in np.random.randint(0,len(color),100) ]
}
)

 

 

#根據每人的身高進行排序
df1.sort_values(by=['height'])

 

#先以身高排序,身高相同按年齡由低到高排序
df1.sort_values(by=['height','age'])

 

 

 

 

sort_values()函數介紹:

 

功能:以dataframe中的索引為依據進行排序,通過傳遞axis參數和排序順序,可以對dataframe進行排序。

參數解釋: 

axis:默認情況下,axis=0,按照行標簽進行排序;axis=1為按照列標簽排序;

ascending:布爾值。默認為True,此時為升序;ascending=False時,降序排列。

 

舉例說明:

#構建新數據集
unsorted_df = pd.DataFrame(np.random.randn(10,2),index=[1,4,6,2,3,5,9,8,0,7],columns = ['col2','col1'])

 

#按照行標簽進行排序
unsorted_df.sort_index()
unsorted_df.sort_index(axis=0)

 

#按照行標簽降序排序
unsorted_df.sort_index(ascending=False)

 

#按照列標簽進行排序
unsorted_df.sort_index(axis=1)

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM