在Numpy中經常使用到的操作由扁平化操作,Numpy提供了兩個函數進行此操作,他們的功能相同,但在內存上有很大的不同.
先來看這兩個函數的使用:
1 from numpy import * 2 3 a = arange(12).reshape(3,4) 4 print(a) 5 # [[ 0 1 2 3] 6 # [ 4 5 6 7] 7 # [ 8 9 10 11]] 8 print(a.ravel()) 9 # [ 0 1 2 3 4 5 6 7 8 9 10 11] 10 print(a.flatten()) 11 # [ 0 1 2 3 4 5 6 7 8 9 10 11]
可以看到這兩個函數實現的功能一樣,但我們在平時使用的時候flatten()更為合適.在使用過程中flatten()分配了新的內存,但ravel()返回的是一個數組的視圖.視圖是數組的引用(說引用不太恰當,因為原數組和ravel()返回后的數組的地址並不一樣),在使用過程中應該注意避免在修改視圖時影響原本的數組.這是什么意思咧,我們通過代碼來具體解釋:
1 from numpy import * 2 3 a = arange(12).reshape(3,4) 4 print(a) 5 # [[ 0 1 2 3] 6 # [ 4 5 6 7] 7 # [ 8 9 10 11]] 8 9 # 創建一個和a相同內容的數組b 10 b = a.copy() 11 c = a.ravel() 12 d = b.flatten() 13 # 輸出c和d數組 14 print(c) 15 # [ 0 1 2 3 4 5 6 7 8 9 10 11] 16 print(d) 17 # [ 0 1 2 3 4 5 6 7 8 9 10 11] 18 # 可以看到c和d數組都是扁平化后的數組,具有相同的內容 19 20 print(a is c) 21 # False 22 print(b is d) 23 # False 24 # 可以看到以上a,b,c,d是四個不同的對象 25 26 # 但因為c是a的一種展示方式,雖然他們是不同的對象,但在修改c的時候,a中相應的數也改變了 27 c[1] = 99 28 d[1] = 99 29 print(a) 30 # [[ 0 99 2 3] 31 # [ 4 5 6 7] 32 # [ 8 9 10 11]] 33 print(b) 34 # [[ 0 1 2 3] 35 # [ 4 5 6 7] 36 # [ 8 9 10 11]] 37 print(c) 38 # [ 0 99 2 3 4 5 6 7 8 9 10 11] 39 print(d) 40 # [ 0 99 2 3 4 5 6 7 8 9 10 11]
通過以上的分析,在實際應用中應盡量使用flatten()函數,這樣避免意外的錯誤.
