以下實例展示了 count() 方法的使用方法:
1
2
3
4
5
6
|
# !/usr/bin/python3
T
=
(
123
,
'Google'
,
'Runoob'
,
'Taobao'
,
123
);
print
(
"123 元素個數 : "
, T.count(
123
))
print
(
"Runoob 元素個數 : "
, T.count(
'Runoob'
))
|
以上實例輸出結果如下:
1
2
|
123
元素個數 :
2
Runoob 元素個數 :
1
|
1) 使用字典dict()
循環遍歷出一個可迭代對象中的元素,如果字典沒有該元素,那么就讓該元素作為字典的鍵,並將該鍵賦值為1,如果存在就將該元素對應的值加1.
lists = ['a','a','b',5,6,7,5] count_dict = dict() for item in lists: if item in count_dict: count_dict[item] += 1 else: count_dict[item] = 1
2) 使用defaultdict()
defaultdict(parameter)
可以接受一個類型參數,如str
,int
等,但傳遞進來的類型參數,不是用來約束值的類型,更不是約束鍵的類型,而是當鍵不存在的話,實現一種值的初始化
- defaultdict(int):初始化為 0
- defaultdict(float):初始化為 0.0
- defaultdict(str):初始化為 ”
from collections import defaultdict lists = ['a', 'a', 'b', 5, 6, 7, 5] count_dict = defaultdict(int) for item in lists: count_dict[item] += 1
- 3)使用集合(set)和列表(list)
先使用set去重,然后循環的把每一個元素和每一個元素對應的次數lists.count(item)
組成一個元組放在列表里面
lists = ['a', 'a', 'b', 5, 6, 7, 5] count_set = set(lists) count_list = list() for item in count_set: count_list.append((item,lists.count(item))
- 4)使用Counter
Counter是一個容器對象,主要的作用是用來統計散列對象,可以使用三種方式來初始化
- 參數里面參數可迭代對象
Counter("success")
- 傳入關鍵字參數
Counter((s=3,c=2,e=1,u=1))
- 傳入字典
Counter({"s":3,"c"=2,"e"=1,"u"=1})
Counter()對象還有幾個可以調用的方法,代碼里面分別進行了說明
from collections import Counter lists = ['a', 'a', 'b', 5, 6, 7, 5] a = Counter(lists) print(a) # Counter({'a': 2, 5: 2, 'b': 1, 6: 1, 7: 1}) a.elements() # 獲取a中所有的鍵,返回的是一個對象,我們可以通過list來轉化它 a.most_common(2) # 前兩個出現頻率最高的元素已經他們的次數,返回的是列表里面嵌套元組 a['zz'] # 訪問不存在的時候,默認返回0 a.update("aa5bzz") # 更新被統計的對象,即原有的計數值與新增的相加,而不是替換 a.subtrct("aaa5z") # 實現與原有的計數值相減,結果運行為0和負值
1.collections模塊
collections模塊自Python 2.4版本開始被引入,包含了dict、set、list、tuple以外的一些特殊的容器類型,分別是:
- OrderedDict類:排序字典,是字典的子類。引入自2.7。
- namedtuple()函數:命名元組,是一個工廠函數。引入自2.6。
- Counter類:為hashable對象計數,是字典的子類。引入自2.7。
- deque:雙向隊列。引入自2.4。
- defaultdict:使用工廠函數創建字典,使不用考慮缺失的字典鍵。引入自2.5。
文檔參見:http://docs.python.org/2/library/collections.html。
2.Counter類
Counter類的目的是用來跟蹤值出現的次數。它是一個無序的容器類型,以字典的鍵值對形式存儲,其中元素作為key,其計數作為value。計數值可以是任意的Interger(包括0和負數)。Counter類和其他語言的bags或multisets很相似。
2.1 創建
下面的代碼說明了Counter類創建的四種方法:
>>> c = Counter() # 創建一個空的Counter類 >>> c = Counter('gallahad') # 從一個可iterable對象(list、tuple、dict、字符串等)創建 >>> c = Counter({'a': 4, 'b': 2}) # 從一個字典對象創建 >>> c = Counter(a=4, b=2) # 從一組鍵值對創建
2.2 計數值的訪問與缺失的鍵
當所訪問的鍵不存在時,返回0,而不是KeyError;否則返回它的計數。
>>> c = Counter("abcdefgab") >>> c["a"] 2 >>> c["c"] 1 >>> c["h"] 0
2.3 計數器的更新(update和subtract)
可以使用一個iterable對象或者另一個Counter對象來更新鍵值。
計數器的更新包括增加和減少兩種。其中,增加使用update()方法:
>>> c = Counter('which') >>> c.update('witch') # 使用另一個iterable對象更新 >>> c['h'] 3 >>> d = Counter('watch') >>> c.update(d) # 使用另一個Counter對象更新 >>> c['h'] 4
減少則使用subtract()方法:
>>> c = Counter('which') >>> c.subtract('witch') # 使用另一個iterable對象更新 >>> c['h'] 1 >>> d = Counter('watch') >>> c.subtract(d) # 使用另一個Counter對象更新 >>> c['a'] -1
2.4 鍵的刪除
當計數值為0時,並不意味着元素被刪除,刪除元素應當使用del
。
>>> c = Counter("abcdcba") >>> c Counter({'a': 2, 'c': 2, 'b': 2, 'd': 1}) >>> c["b"] = 0 >>> c Counter({'a': 2, 'c': 2, 'd': 1, 'b': 0}) >>> del c["a"] >>> c Counter({'c': 2, 'b': 2, 'd': 1})
2.5 elements()
返回一個迭代器。元素被重復了多少次,在該迭代器中就包含多少個該元素。元素排列無確定順序,個數小於1的元素不被包含。
>>> c = Counter(a=4, b=2, c=0, d=-2) >>> list(c.elements()) ['a', 'a', 'a', 'a', 'b', 'b']
2.6 most_common([n])
返回一個TopN列表。如果n沒有被指定,則返回所有元素。當多個元素計數值相同時,排列是無確定順序的。
>>> c = Counter('abracadabra') >>> c.most_common() [('a', 5), ('r', 2), ('b', 2), ('c', 1), ('d', 1)] >>> c.most_common(3) [('a', 5), ('r', 2), ('b', 2)]
2.7 fromkeys
未實現的類方法。
2.8 淺拷貝copy
>>> c = Counter("abcdcba") >>> c Counter({'a': 2, 'c': 2, 'b': 2, 'd': 1}) >>> d = c.copy() >>> d Counter({'a': 2, 'c': 2, 'b': 2, 'd': 1})
2.9 算術和集合操作
+、-、&、|操作也可以用於Counter。其中&和|操作分別返回兩個Counter對象各元素的最小值和最大值。需要注意的是,得到的Counter對象將刪除小於1的元素。
>>> c = Counter(a=3, b=1) >>> d = Counter(a=1, b=2) >>> c + d # c[x] + d[x] Counter({'a': 4, 'b': 3}) >>> c - d # subtract(只保留正數計數的元素) Counter({'a': 2}) >>> c & d # 交集: min(c[x], d[x]) Counter({'a': 1, 'b': 1}) >>> c | d # 並集: max(c[x], d[x]) Counter({'a': 3, 'b': 2})
3.常用操作
下面是一些Counter類的常用操作,來源於Python官方文檔
sum(c.values()) # 所有計數的總數 c.clear() # 重置Counter對象,注意不是刪除 list(c) # 將c中的鍵轉為列表 set(c) # 將c中的鍵轉為set dict(c) # 將c中的鍵值對轉為字典 c.items() # 轉為(elem, cnt)格式的列表 Counter(dict(list_of_pairs)) # 從(elem, cnt)格式的列表轉換為Counter類對象 c.most_common()[:-n:-1] # 取出計數最少的n個元素 c += Counter() # 移除0和負值