python中如何對數據進行各種排序?


Python列表具有內置的 list.sort()方法,可以在原地修改列表。 還有一個 sorted()內置的函數從迭代構建一個新的排序列表。在本文中,我們將探討使用Python排序數據的各種技術。轉自http://mp.weixin.qq.com/s?__biz=MzI5NDY1MjQzNA==&mid=2247484360&idx=2&sn=5e0d78a129f7be71dee355ae1492b8b9&chksm=ec5edcb5db2955a37972ca8bd3fd22572914dac8b4852e622a5afd8b24b999f4967bed7e444d&mpshare=1&scene=23&srcid=0910RYUt9YnMlda0hid9zem2#rd

請注意,sort()原始數據被破壞,sorted()沒有對原始數據進行操作,而是新建了一個新數據。

一、基本的排序
最基本的排序很簡單。只要使用sorted()函數即可返回一個 新的排序的列表

>>>sorted([5, 2, 3, 1, 4])
[1, 2, 3, 4, 5]
咱們也可以使用 list.sort()方法。該方法是對列表list進行的原地操作(原數據被修改,已經不是原來的本來面目)。一般情況下,不如使用 sorted()方便,但是如果你不需要原列表list,使用 sort()會更具效率。

>>>a = [5, 2, 3, 1, 4]
>>>a.sort()
>>>a #a發生改變
[1, 2, 3, 4, 5]
另一個不同點, list.sort()方法只能應用於列表對象數據。而 sorted()卻可以對任何可迭代對象進行排序。也就是說sorted()更具有普遍使用性。這里大燈建議初學者使用sorted()。

二、Key參數函數
list.sort()和 sorted()都有key參數,可以指定函數來對元素進行排序。

例如,這里我們使用一個字符串(字符串也是可迭代對象)

>>>sorted("This is a test string from Andrew".split(), key=str.lower)
['a', 'Andrew', 'from', 'is', 'string', 'test', 'This']
我們指定按照首字符(統一變為小寫后的字符)進行排序。 key參數的值是一個帶有單一參數的函數,返回一個鍵key用於排序。這種技術運行挺快的,具體為啥,我不懂。

例如:

>>>student_tuples = [
... ('john', 'A', 15),
... ('jane', 'B', 12),
... ('dave', 'B', 10)]
>>>sorted(student_tuples, key = lambda student:student[2])
"""
通過key排序。
key的值: lambda函數
lambda函數的參數 是student_tuples列表中的元素-元組
lambda函數運算的是 student_tuples列表元素中元組的第三個元素。
"""
[('dave', 'B', 10), ('jane', 'B', 12), ('john', 'A', 15)]
同樣該方法也可作用於對象的屬性。例如這里我先定義一個屬性

>>> class Student:
... def __init__(self, name, grade, age):
... self.name = name
... self.grade = grade
... self.age = age
... def __repr__(self):
... return repr((self.name, self.grade, self.age))
>>> student_objects = [
... Student('john', 'A', 15),
... Student('jane', 'B', 12),
... Student('dave', 'B', 10)]
>>> sorted(student_objects, key=lambda student: student.age)
[('dave', 'B', 10), ('jane', 'B', 12), ('john', 'A', 15)]

三、Operator庫的方法
上面列的那些key函數方法都是非常常見,所以說python提供簡潔高效的方法。 operator庫有 itemgetter(), attrgetter(), methodcaller()這三個方法。

使用上面提到的operator庫的方法,也可以實現上述例子,而且更簡單,運行更快。

>>> from operator import itemgetter, attrgetter
>>> sorted(student_tuples, key=itemgetter(2))
[('dave', 'B', 10), ('jane', 'B', 12), ('john', 'A', 15)]
>>> sorted(student_objects, key=attrgetter('age'))
[('dave', 'B', 10), ('jane', 'B', 12), ('john', 'A', 15)]
operator庫的方法可以提供多維度排序。例如我們隊成績和年齡同時排序,但成績的優先級高於年齡。

>>> sorted(student_tuples, key=itemgetter(1,2))
[('john', 'A', 15), ('dave', 'B', 10), ('jane', 'B', 12)]
>>> sorted(student_objects, key=attrgetter('grade', 'age'))
[('john', 'A', 15), ('dave', 'B', 10), ('jane', 'B', 12)]

四、升序與降序
list.sort()和 sorted()都可以通過reverse參數(True或False)進行升降序調整。這里我們對student數據中 年齡age進行翻轉排序規則。

>>> sorted(student_tuples, key=itemgetter(2), reverse=True)
[('john', 'A', 15), ('jane', 'B', 12), ('dave', 'B', 10)]
>>> sorted(student_objects, key=attrgetter('age'), reverse=True)
[('john', 'A', 15), ('jane', 'B', 12), ('dave', 'B', 10)]

五、排序穩定性和復雜排序
排序要保障穩定,這意味着當多個記錄擁有同一個key時,原始的數據中的排序會保留下來。

>>> data = [('red', 1), ('blue', 1), ('red', 2), ('blue', 2)]
>>> sorted(data, key=itemgetter(0))
[('blue', 1), ('blue', 2), ('red', 1), ('red', 2)]
注意為何兩個記錄中的blue保留了原始數據的數據,所以按照原始數據順序,('blue', 1)比('blue', 2)優先。

這個奇妙的特性讓咱們可以使用一系列排序步驟來構建復雜的排序方法。例如,對student數據的 成績grade進行降序,再對 年齡age進行升序排序。實現方法:首先對age排序,再對grade排序。

>>> s = sorted(student_objects, key=attrgetter('age'))
>>> sorted(s, key=attrgetter('grade'), reverse=True)
[('dave', 'B', 10), ('jane', 'B', 12), ('john', 'A', 15)]

六、老辦法-使用cmp參數
cmp也就是compare,對比比較。在2.x時代,都支持cmp參數方法。

在3.x中,cmp參數被徹底移除。

在2.x中,sort允許一個可選的函數,可以進行比較compare。 該功能應該采取要比較兩個參數,然后返回的負值代表小於;返回零,代表相等;正值代表大於。 在3.x中,使用cmp思想,我們可以這樣做:

>>> def numeric_compare(x, y):
... return x - y
>>> sorted([5, 2, 4, 1, 3], cmp=numeric_compare)
[1, 2, 3, 4, 5]

如果想讓排序變為降序,可以使用下面

>>> def reverse_numeric(x, y):
... return y - x
>>> sorted([5, 2, 4, 1, 3], cmp=reverse_numeric)
[5, 4, 3, 2, 1]


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM