python中統計計數的幾種方法


以下實例展示了 count() 方法的使用方法:

1
2
3
4
5
6
# !/usr/bin/python3
 
=  ( 123 'Google' 'Runoob' 'Taobao' 123 );
 
print  ( "123 元素個數 : " , T.count( 123 ))
print  ( "Runoob 元素個數 : " , T.count( 'Runoob' ))

以上實例輸出結果如下:

1
2
123  元素個數 :   2
Runoob 元素個數 :   1

1) 使用字典dict()

循環遍歷出一個可迭代對象中的元素,如果字典沒有該元素,那么就讓該元素作為字典的鍵,並將該鍵賦值為1,如果存在就將該元素對應的值加1.

lists = ['a','a','b',5,6,7,5] count_dict = dict() for item in lists: if item in count_dict: count_dict[item] += 1 else: count_dict[item] = 1

2) 使用defaultdict()

defaultdict(parameter)可以接受一個類型參數,如str,int等,但傳遞進來的類型參數,不是用來約束值的類型,更不是約束鍵的類型,而是當鍵不存在的話,實現一種值的初始化

  1. defaultdict(int):初始化為 0
  2. defaultdict(float):初始化為 0.0
  3. defaultdict(str):初始化為 ”
from collections import defaultdict lists = ['a', 'a', 'b', 5, 6, 7, 5] count_dict = defaultdict(int) for item in lists: count_dict[item] += 1
  • 3)使用集合(set)和列表(list)

先使用set去重,然后循環的把每一個元素和每一個元素對應的次數lists.count(item)組成一個元組放在列表里面

lists = ['a', 'a', 'b', 5, 6, 7, 5] count_set = set(lists) count_list = list() for item in count_set: count_list.append((item,lists.count(item))
  • 4)使用Counter

Counter是一個容器對象,主要的作用是用來統計散列對象,可以使用三種方式來初始化

  1. 參數里面參數可迭代對象 Counter("success")
  2. 傳入關鍵字參數Counter((s=3,c=2,e=1,u=1))
  3. 傳入字典 Counter({"s":3,"c"=2,"e"=1,"u"=1})

Counter()對象還有幾個可以調用的方法,代碼里面分別進行了說明

from collections import Counter lists = ['a', 'a', 'b', 5, 6, 7, 5] a = Counter(lists) print(a) # Counter({'a': 2, 5: 2, 'b': 1, 6: 1, 7: 1}) a.elements() # 獲取a中所有的鍵,返回的是一個對象,我們可以通過list來轉化它 a.most_common(2) # 前兩個出現頻率最高的元素已經他們的次數,返回的是列表里面嵌套元組 a['zz'] # 訪問不存在的時候,默認返回0 a.update("aa5bzz") # 更新被統計的對象,即原有的計數值與新增的相加,而不是替換 a.subtrct("aaa5z") # 實現與原有的計數值相減,結果運行為0和負值

1.collections模塊

collections模塊自Python 2.4版本開始被引入,包含了dict、set、list、tuple以外的一些特殊的容器類型,分別是:

  • OrderedDict類:排序字典,是字典的子類。引入自2.7。
  • namedtuple()函數:命名元組,是一個工廠函數。引入自2.6。
  • Counter類:為hashable對象計數,是字典的子類。引入自2.7。
  • deque:雙向隊列。引入自2.4。
  • defaultdict:使用工廠函數創建字典,使不用考慮缺失的字典鍵。引入自2.5。

文檔參見:http://docs.python.org/2/library/collections.html

2.Counter類

Counter類的目的是用來跟蹤值出現的次數。它是一個無序的容器類型,以字典的鍵值對形式存儲,其中元素作為key,其計數作為value。計數值可以是任意的Interger(包括0和負數)。Counter類和其他語言的bags或multisets很相似。

2.1 創建

下面的代碼說明了Counter類創建的四種方法:

>>> c = Counter()  # 創建一個空的Counter類
>>> c = Counter('gallahad')  # 從一個可iterable對象(list、tuple、dict、字符串等)創建
>>> c = Counter({'a': 4, 'b': 2})  # 從一個字典對象創建
>>> c = Counter(a=4, b=2)  # 從一組鍵值對創建

2.2 計數值的訪問與缺失的鍵

當所訪問的鍵不存在時,返回0,而不是KeyError;否則返回它的計數。

復制代碼
>>> c = Counter("abcdefgab")
>>> c["a"]
2
>>> c["c"]
1
>>> c["h"]
0
復制代碼

2.3 計數器的更新(update和subtract)

可以使用一個iterable對象或者另一個Counter對象來更新鍵值。

計數器的更新包括增加和減少兩種。其中,增加使用update()方法:

復制代碼
>>> c = Counter('which')
>>> c.update('witch')  # 使用另一個iterable對象更新
>>> c['h']
3
>>> d = Counter('watch')
>>> c.update(d)  # 使用另一個Counter對象更新
>>> c['h']
4
復制代碼

減少則使用subtract()方法:

復制代碼
>>> c = Counter('which')
>>> c.subtract('witch')  # 使用另一個iterable對象更新
>>> c['h']
1
>>> d = Counter('watch')
>>> c.subtract(d)  # 使用另一個Counter對象更新
>>> c['a']
-1
復制代碼

2.4 鍵的刪除

當計數值為0時,並不意味着元素被刪除,刪除元素應當使用del

復制代碼
>>> c = Counter("abcdcba")
>>> c
Counter({'a': 2, 'c': 2, 'b': 2, 'd': 1})
>>> c["b"] = 0
>>> c
Counter({'a': 2, 'c': 2, 'd': 1, 'b': 0})
>>> del c["a"]
>>> c
Counter({'c': 2, 'b': 2, 'd': 1})
復制代碼

2.5 elements()

返回一個迭代器。元素被重復了多少次,在該迭代器中就包含多少個該元素。元素排列無確定順序,個數小於1的元素不被包含。

>>> c = Counter(a=4, b=2, c=0, d=-2)
>>> list(c.elements())
['a', 'a', 'a', 'a', 'b', 'b']

2.6 most_common([n])

返回一個TopN列表。如果n沒有被指定,則返回所有元素。當多個元素計數值相同時,排列是無確定順序的。

>>> c = Counter('abracadabra')
>>> c.most_common()
[('a', 5), ('r', 2), ('b', 2), ('c', 1), ('d', 1)]
>>> c.most_common(3)
[('a', 5), ('r', 2), ('b', 2)]

2.7 fromkeys

未實現的類方法。

2.8 淺拷貝copy

復制代碼
>>> c = Counter("abcdcba")
>>> c
Counter({'a': 2, 'c': 2, 'b': 2, 'd': 1})
>>> d = c.copy()
>>> d
Counter({'a': 2, 'c': 2, 'b': 2, 'd': 1})
復制代碼

2.9 算術和集合操作

+、-、&、|操作也可以用於Counter。其中&和|操作分別返回兩個Counter對象各元素的最小值和最大值。需要注意的是,得到的Counter對象將刪除小於1的元素。

復制代碼
>>> c = Counter(a=3, b=1)
>>> d = Counter(a=1, b=2)
>>> c + d  # c[x] + d[x]
Counter({'a': 4, 'b': 3})
>>> c - d  # subtract(只保留正數計數的元素)
Counter({'a': 2})
>>> c & d  # 交集:  min(c[x], d[x])
Counter({'a': 1, 'b': 1})
>>> c | d  # 並集:  max(c[x], d[x])
Counter({'a': 3, 'b': 2})
復制代碼

3.常用操作

下面是一些Counter類的常用操作,來源於Python官方文檔

復制代碼
sum(c.values())  # 所有計數的總數
c.clear()  # 重置Counter對象,注意不是刪除
list(c)  # 將c中的鍵轉為列表
set(c)  # 將c中的鍵轉為set
dict(c)  # 將c中的鍵值對轉為字典
c.items()  # 轉為(elem, cnt)格式的列表
Counter(dict(list_of_pairs))  # 從(elem, cnt)格式的列表轉換為Counter類對象
c.most_common()[:-n:-1]  # 取出計數最少的n個元素
c += Counter()  # 移除0和負值
 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM