Python實用黑科技——以某個字段進行分組


需求:
當前有個字典實例,你想以某個字段比如”日期”對整個字典里面的元素進行分組。

方法:
itertools.groupby()函數是專門用來干這個活的。請看下面這個例子,這里有一個列表構成的字典,你想按照日期來對列表進行分組,可以這么做:

In [42]: from operator import itemgetter

In [43]: from itertools import groupby

In [44]: rows = [
...: {'address' : '5412 N CLARK', 'date' : '07/01/2012'},
...: {'address' : '5148 N CLARK', 'date' : '07/04/2012'},
...: {'address' : '5800 E 58TH', 'date' : '07/02/2012'},
...: {'address' : '2122 N CLARK', 'date' : '07/03/2012'},
...: {'address' : '5645 N RAVENSWOOD', 'date' : '07/02/2012'},
...: {'address' : '1060 W ADDISION', 'date' : '07/02/2012'},
...: {'address' : '4801 N BROADWAY', 'date' : '07/01/2012'},
...: {'address' : '1039 W GRANVILLE', 'date' : '07/04/2012'}
...: ]

In [45]: rows.sort(key=itemgetter('date'))

In [46]: for date, items in groupby(rows, key=itemgetter('date')):
...: print(date)
...: for i in items:
...: print(' ', i)
...:
07/01/2012
{'address': '5412 N CLARK', 'date': '07/01/2012'}
{'address': '4801 N BROADWAY', 'date': '07/01/2012'}
07/02/2012
{'address': '5800 E 58TH', 'date': '07/02/2012'}
{'address': '5645 N RAVENSWOOD', 'date': '07/02/2012'}
{'address': '1060 W ADDISION', 'date': '07/02/2012'}
07/03/2012
{'address': '2122 N CLARK', 'date': '07/03/2012'}
07/04/2012
{'address': '5148 N CLARK', 'date': '07/04/2012'}
{'address': '1039 W GRANVILLE', 'date': '07/04/2012'}

擴展:
實用groupby()函數前,必須對相應的要分組的字段進行排序,因為他只能對有序數據進行分組。如果你僅僅只是想針對日期進行分組並且允許隨機獲取,那可能更好的方法是實用defaultdict()先產生一個多維字典,例如:

In [48]: from collections import defaultdict

In [49]: rows_by_date = defaultdict(list)

In [50]: for row in rows:
...: rows_by_date[row['date']].append(row)
...:

In [51]: for r in rows_by_date['07/01/2012']:
...: print(r)
...:
{'address': '5412 N CLARK', 'date': '07/01/2012'}
{'address': '4801 N BROADWAY', 'date': '07/01/2012'}

對於這個例子,並不需要先對記錄進行排序。因此如果不需要考慮內存,用這個方法比用groupby()要快得多。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM