df.sort_values() 按照某列排序


sort_value

sort_values,按照某一列的大小進行排序,(沿任一軸的值排序)

DataFrame.sort_values(by,axis = 0,ascending = True,inplace = False,kind = ' quicksort ',na_position = 'last',ignore_index = False,key = None)

參數:

  1. by:str or list of str,就是要根據哪一列排序的列名,或者是索引名,是str類型,或者是list
  2. axis:{0 or ‘index’, 1 or ‘columns’}, default 0,要排序的軸,如果不記得0、1代表着什么,可以使用index或者columns代替。
  3. ascending:bool or list of bool, default True,按升序還是降序排序。指定多個排序順序的列表。如果這是布爾列表,則必須與by的長度匹配
  4. inplace:bool, default False
  5. kind:{‘quicksort’, ‘mergesort’, ‘heapsort’}, default ‘quicksort’,選擇排序算法
  6. na_position:{‘first’, ‘last’}, default ‘last’,是將控制放在最開始還是最后,默認是最后
  7. ignore_index:bool, default False,如果為True,則結果軸將標記為0、1,…,n-1。
  8. key:callable, optional,在排序之前,將鍵函數應用於這些值,別是此key函數應被向量化

 

官網例子

df = pd.DataFrame({
    'col1': ['A', 'A', 'B', np.nan, 'D', 'C'],
    'col2': [2, 1, 9, 8, 7, 4],
    'col3': [0, 1, 9, 4, 2, 3],
    'col4': ['a', 'B', 'c', 'D', 'e', 'F']
})
df
  col1  col2  col3 col4
0 A 2 0 a 1 A 1 1 B 2 B 9 9 c 3 NaN 8 4 D 4 D 7 2 e 5 C 4 3 F

按col1排序

df.sort_values(by=['col1'])
  col1  col2  col3 col4
0 A 2 0 a 1 A 1 1 B 2 B 9 9 c 5 C 4 3 F 4 D 7 2 e 3 NaN 8 4 D

按多列排序

df.sort_values(by=['col1', 'col2'])
  col1  col2  col3 col4
1 A 1 1 B 0 A 2 0 a 2 B 9 9 c 5 C 4 3 F 4 D 7 2 e 3 NaN 8 4 D

降序排列

df.sort_values(by='col1', ascending=False)
  col1  col2  col3 col4
4 D 7 2 e 5 C 4 3 F 2 B 9 9 c 0 A 2 0 a 1 A 1 1 B 3 NaN 8 4 D

將NA放在首位

df.sort_values(by='col1', ascending=False, na_position='first')
  col1  col2  col3 col4
3 NaN 8 4 D 4 D 7 2 e 5 C 4 3 F 2 B 9 9 c 0 A 2 0 a 1 A 1 1 B

按鍵功能排序

df.sort_values(by='col4', key=lambda col: col.str.lower())
   col1  col2  col3 col4
0 A 2 0 a 1 A 1 1 B 2 B 9 9 c 3 NaN 8 4 D 4 D 7 2 e 5 C 4 3 F

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM