介紹:
Python collections.Counter用法詳解,Counter 計數器,顧名思義就是用來計數的,最主要的作用就是計算“可迭代序列中”各個元素(element)的數量。具體用法參看目錄,基本涵蓋了主要用法。
01.統計“可迭代序列”中每個元素的出現的次數
#首先引入該方法 from collections import Counter
對列表/字符串作用
#對列表作用 list_01 = [1,9,9,5,0,8,0,9] #GNZ48-陳珂生日 print(Counter(list_01)) #Counter({9: 3, 0: 2, 1: 1, 5: 1, 8: 1}) #對字符串作用 temp = Counter('abcdeabcdabcaba') print(temp) #Counter({'a': 5, 'b': 4, 'c': 3, 'd': 2, 'e': 1}) #以上其實是兩種使用方法,一種是直接用,一種是實例化以后使用,如果要頻繁調用的話,顯然后一種更簡潔
以上其實是兩種使用方法,一種是直接使用,一種是實例化以后使用,如果要頻繁調用的話,顯然后一種更簡潔 ,因為可以方便地調用Counter內的各種方法。
對於其他可迭代序列也是一樣的套路。
輸出結果
#查看類型 print( type(temp) ) #<class 'collections.Counter'> #轉換為字典后輸出 print( dict(temp) ) #{'b': 4, 'a': 5, 'c': 3, 'd': 2, 'e': 1} for num,count in enumerate(dict(temp).items()): print(count) """ ('e', 1) ('c', 3) ('a', 5) ('b', 4) ('d', 2) """
用自帶的items()方法輸出
顯然這個方法比轉換為字典后再輸出的方法更為方便。
print(temp.items()) #dict_items([('e', 1), ('c', 3), ('b', 4), ('d', 2), ('a', 5)]) for item in temp.items(): print(item) """ ('a', 5) ('c', 3) ('d', 2) ('e', 1) ('b', 4) """
02.統計出現次數最多的元素
利用most_common()方法
#求序列中出現次數最多的元素 from collections import Counter list_01 = [1,9,9,5,0,8,0,9] temp = Counter(list_01) #統計出現次數最多的一個元素 print(temp.most_common(1)) #[(9, 3)] 元素“9”出現3次。 print(temp.most_common(2)) #[(9, 3), (0, 2)] 統計出現次數最多個兩個元素 #沒有指定個數,就列出全部 print(temp.most_common()) #[(9, 3), (0, 2), (1, 1), (5, 1), (8, 1)]
03.elements()和sort()方法
關於elements()方法,官方的幫助文檔是這樣寫的,Iterator over elements repeating each as many times as its count. 。
或許可以翻譯為:按照元素出現次數迭代。所以用漢語比較難解釋,直接看例子會比較方便了解。
from collections import Counter c = Counter('ABCABCCC') print(c.elements()) #<itertools.chain object at 0x0000027D94126860> #嘗試轉換為list print(list(c.elements())) #['A', 'A', 'C', 'C', 'C', 'C', 'B', 'B'] #或者這種方式 print(sorted(c.elements())) #['A', 'A', 'B', 'B', 'C', 'C', 'C', 'C'] #這里與sorted的作用是: list all unique elements,列出所有唯一元素 #例如 print( sorted(c) ) #['A', 'B', 'C']
一個來自官方文檔的例子,還蠻有意思的。
# Knuth's example for prime factors of 1836: 2**2 * 3**3 * 17**1 prime_factors = Counter({2: 2, 3: 3, 17: 1}) product = 1 for factor in prime_factors.elements(): # loop over factors product *= factor # and multiply them print(product) #1836 #1836 = 2*2*3*3*3*17
注意,如果數量為“0”,或者是負值,則忽略。
04.計算元素總數/Keys()&Values()
from collections import Counter c = Counter('ABCABCCC') print(sum(c.values())) # 8 total of all counts print(c.keys()) #dict_keys(['A', 'B', 'C']) print(c.values()) #dict_values([2, 2, 4])
05.對具體元素的操作
查詢單元素結果
from collections import Counter c = Counter('ABBCC') #查詢具體某個元素的個數 print(c["A"]) #1
添加
for elem in 'ADD': # update counts from an iterabl c[elem] += 1 print(c.most_common()) #[('C', 2), ('D', 2), ('A', 2), ('B', 2)] #可以看出“A”增加了一個,新增了兩個“D”
刪除(del)
del c["D"] print(c.most_common()) #[('C', 2), ('A', 2), ('B', 2)] del c["C"] print(c.most_common()) #[('A', 2), ('B', 2)]
更新(update)
d = Counter("CCDD") c.update(d) print(c.most_common()) #[('B', 2), ('A', 2), ('C', 2), ('D', 2)]
增加與減少(+-)
示例一
c['C'] -= 2 print(c.most_common()) # [('D', 2), ('A', 2), ('B', 2), ('C', 0)] # 本來上面,C有兩個,現在只有零個了,被減少了。 #注意官方文檔的這句話 # If a count is set to zero or reduced to zero, it will remain in the counter until the entry is deleted or the counter is cleared # 如果計數設置為零或減少為零,它將保留在計數器中,直到刪除條目或清除計數器: c['C'] += 1 print(c.most_common()) # [('D', 2), ('A', 2), ('B', 2), ('C', 1)] # C又變成一個了。
示例二
print(Counter('AAB') + Counter('BCC')) #Counter({'B': 2, 'C': 2, 'A': 2}) print(Counter("AAB")-Counter("BCC")) #Counter({'A': 2})
subtract的“減”操作
subtract_test01 = Counter("AAB") subtract_test01.subtract("BCC") print(subtract_test01) #Counter({'A': 2, 'B': 0, 'C': -2})
這里的計數可以減到零一下,可以包含零和負數。
subtract_test02 = Counter("which") subtract_test02.subtract("witch") #從另一個迭代序列中減去元素 subtract_test02.subtract(Counter("watch")) #^…… #查看結果 print( subtract_test02["h"] ) # 0 ,whirch 中兩個,減去witch中一個,減去watch中一個,剩0個 print( subtract_test02["w"] ) #-1
清除
c.clear() print(c) #Counter()
06.“與”和“或”操作
print(Counter('AAB') & Counter('BBCC')) #Counter({'B': 1}) print(Counter('AAB') | Counter('BBCC')) #Counter({'A': 2, 'C': 2, 'B': 2})