numpy之初探排序和集合運算

本文轉載自查看原文 2017-05-25 20:32 5095 python/ numpy

排序

numpy與python列表內置的方法類似，也可通過sort方法進行排序。

用法如下：


In [1]: import numpy as np

In [2]: x = np.random.randn(9)

In [3]: x
Out[3]:
array([-0.4041504 , -0.42198556,  0.92807217, -2.66609196,  1.50915897,
        0.38080873,  1.05325796, -1.16488798,  0.04062064])

In [4]: x.sort()

In [5]: x
Out[5]:
array([-2.66609196, -1.16488798, -0.42198556, -0.4041504 ,  0.04062064,
        0.38080873,  0.92807217,  1.05325796,  1.50915897])

可以發現上述的sort方法是直接對x進行了排序而並沒有創建一個副本。
但是np.sort()這個頂級的方法，會返回一個副本：

In [6]: x = np.random.randn(6)

In [7]: x
Out[7]:
array([ 0.14240205,  0.48903869,  0.22528632,  1.31659382,  0.00352338,
        0.95574862])

In [8]: np.sort(x)
Out[8]:
array([ 0.00352338,  0.14240205,  0.22528632,  0.48903869,  0.95574862,
        1.31659382])

In [9]: x
Out[9]:
array([ 0.14240205,  0.48903869,  0.22528632,  1.31659382,  0.00352338,
        0.95574862])

傳入軸編號，可以實現在某一個軸向上進行排序。

In [34]: x = np.random.randn(5,4)

In [35]: x
Out[35]:
array([[-0.26646799, -0.40714749, -0.76788268, -0.25340467],
       [ 0.70099086, -0.88716684,  0.13461279,  2.14412835],
       [ 0.39718924, -0.14671297, -0.67821163,  1.85798273],
       [-0.29389289,  0.0346094 ,  0.25213133,  0.87105479],
       [-0.10797243,  1.60188878,  0.67829493,  0.43291808]])

In [36]: s = x

In [37]: s.sort(0)#按列進行排序

In [38]: s
Out[38]:
array([[-0.29389289, -0.88716684, -0.76788268, -0.25340467],
       [-0.26646799, -0.40714749, -0.67821163,  0.43291808],
       [-0.10797243, -0.14671297,  0.13461279,  0.87105479],
       [ 0.39718924,  0.0346094 ,  0.25213133,  1.85798273],
       [ 0.70099086,  1.60188878,  0.67829493,  2.14412835]])

In [39]: x
Out[39]:
array([[-0.29389289, -0.88716684, -0.76788268, -0.25340467],
       [-0.26646799, -0.40714749, -0.67821163,  0.43291808],
       [-0.10797243, -0.14671297,  0.13461279,  0.87105479],
       [ 0.39718924,  0.0346094 ,  0.25213133,  1.85798273],
       [ 0.70099086,  1.60188878,  0.67829493,  2.14412835]])


In [40]: x = np.random.randn(5,4)

In [41]: x
Out[41]:
array([[ 0.82309157, -0.56413805, -0.1766557 , -0.31924962],
       [-1.25606694,  2.63622922,  2.47481377,  0.27840961],
       [ 0.63659583,  1.52779004, -0.90582752,  0.82325241],
       [-1.52664294, -0.5285837 , -1.96380368, -0.44323125],
       [ 1.94859294,  2.55676806,  1.53614848, -0.43366557]])

In [42]: x.sort(1)#按行進行排序

In [43]: x
Out[43]:
array([[-0.56413805, -0.31924962, -0.1766557 ,  0.82309157],
       [-1.25606694,  0.27840961,  2.47481377,  2.63622922],
       [-0.90582752,  0.63659583,  0.82325241,  1.52779004],
       [-1.96380368, -1.52664294, -0.5285837 , -0.44323125],
       [-0.43366557,  1.53614848,  1.94859294,  2.55676806]])

在這兒，我試圖將x賦值給s，結果發現對s排序后，x也變了，這說明，在內存中，實際上，s，x是指向同一組值得。

我也曾試圖輸入 s.sort(2),結果出現了ValueError: axis(=2) out of bounds,這也就和前面的統計函數的axis參數是一致的。

那么也就是說，他的用法和axis一致。

利用排序，我們還能得到分位數（
分位數（英語：Quantile），亦稱分位點，是指將一個隨機變量的概率分布范圍分為幾個等份的數值點，常用的有中位數（即二分位數）、四分位數、百分位數等。具體可自行搜索），從而得到特定位置的值。


In [44]: x = np.random.randn(500)

In [45]: x.sort()

In [46]: x[int(0.05 * len(x))] #5%分位數
Out[46]: -1.7657191623368329

還有很多沒有深入了解，比如怎么降序排列，待續。

集合運算

unique(x)返回集合中的唯一值，並排序，其實也就是去除重復值。


In [1]: import numpy as np

In [2]: str = np.array(['s','f','r','s','d','f','w','r'])

In [3]: np.unique(str)
Out[3]:
array(['d', 'f', 'r', 's', 'w'],
      dtype='<U1')

In [4]: i = np.array([2,2,2,2,1,1,3,4,5,4,3,5])

In [5]: np.unique(i)
Out[5]: array([1, 2, 3, 4, 5])

intersect1d(x,y)返回集合A和B的交集，並排序

In [6]: k = np.arange(8)

In [7]: np.intersect1d(i, k)
Out[7]: array([1, 2, 3, 4, 5])

union1d(x,y)返回集合A和B的並集，並排序

In [8]: np.union1d(i,k)
Out[8]: array([0, 1, 2, 3, 4, 5, 6, 7])

in1d(x,y)返回一個A包含於B的布爾型數組


In [10]: np.in1d(k,i)
Out[10]: array([False,  True,  True,  True,  True,  True, False, False], dtype=bool)

setdiff1d(x,y)集合的差，包含於A但不包含於B,相當於A-（A∩B)


In [12]: np.setdiff1d(k,i)
Out[12]: array([0, 6, 7])

setxor1d(x,y)存在於A中但不同時存在於B中，也就是對稱差，說白了就是A和B交集之外的部分。

對稱差

就是紅色的部分。

In [13]: s = np.arange(4,12)

In [14]: s
Out[14]: array([ 4,  5,  6,  7,  8,  9, 10, 11])

In [15]: np.setxor1d(s,k)
Out[15]: array([ 0,  1,  2,  3,  8,  9, 10, 11])

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 NumPy 中的集合運算 numpy中的數組之間進行集合運算 numpy 數組集合運算及下標操作 Promise 之初探進階之初探nodeJS numpy之初識ndarray EntityFramework 7.0之初探【基於VS 2015】（十） HTML5+MUI+HBuilder 之初探情人 EntityFramework 7.0之初探【基於VS 2015】（ AutoMapper搬運工之初探AutoMapper