Python教程：unique()與nunique()函數

本文轉載自查看原文 2020-09-26 21:25 1486 python

1 unique()

統計list中的不同值時，返回的是array.它有三個參數，可分別統計不同的量，返回的都是array.

當list中的元素也是list時，盡量不要用這種方法.

import numpy as np
a = [1,5,4,2,3,3,5]
# 返回一個array
print(np.unique(a))
# [1 2 3 4 5]
 
# 返回該元素在list中第一次出現的索引
print(np.unique(a,return_index=True))
# (array([1, 2, 3, 4, 5]), array([0, 3, 4, 2, 1]))
 
# 返回原list中每個元素在新的list中對應的索引
print(np.unique(a,return_inverse=True))
# (array([1, 2, 3, 4, 5]), array([0, 4, 3, 1, 2, 2, 4]))
 
# 返回該元素在list中出現的次數
print(np.unique(a,return_counts=True))
# (array([1, 2, 3, 4, 5]), array([1, 1, 2, 1, 2]))
 
# 當加參數時，unique()返回的是一個tuple,這里利用了tuple的性質，即有多少個元素即可賦值給對應的多少個變量
p,q,m,n = np.unique(a,return_index=True,return_inverse=True,return_counts=True)
print(p,q,m,n)
# [1 2 3 4 5] [0 3 4 2 1] [0 4 3 1 2 2 4] [1 1 2 1 2]
 
# 注意當list中的元素不是數字而是list的時候,輸出的數據類型與list中元素的長度有關
# 利用這種方法對list中元素去重或求里面元素的個數都不是好方法，很容易出錯

統計series中的不同值時，返回的是array，它沒有其它參數

import pandas as pd
se = pd.Series([1,3,4,5,2,2,3])
print(se.unique())
# [1 3 4 5 2]

2.nunique()

可直接統計dataframe中每列的不同值的個數,也可用於series,但不能用於list.返回的是不同值的個數.

df=pd.DataFrame({'A':[0,1,1],'B':[0,5,6]})
print(df)
print(df.nunique())
#    A  B
# 0  0  0
# 1  1  5
# 2  1  6
# A    2
# B    3
# dtype: int64

也可與groupby結合使用,統計每個塊的不同值的個數.

all_user_repay = all_user_repay.groupby(['user_id'])['listing_id'].agg(['nunique']).reset_index()
#    user_id  nunique
# 0       40        1
# 1       56        1
# 2       98        1
# 3      103        1
# 4      122        1

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 unique()與nunique() Pandas unique函數 python中的unique() matlab中的unique函數詳解 Matlab中unique函數和tabulate函數的區別 [leetcode]Unique Paths II @ Python 【整理】C++中的unique函數 C++中unique函數的用法總結 C++STL中的unique函數解析 C++STL——unique函數總結