numpy是一個多維的數組對象,類似python的列表,但是數組對象的每個元素之間由空格隔開。
一、數組的創建
1.通過numpy的array(參數),參數可以是列表、元組、數組、生成器等
由arr2和arr3看出,對於多維數組來說,如果最里層的數據類型不一致,array()會將其轉化為一致
由arr2和arr4看出,對於最里層的數據個數不一致,array()的結果只是一個一維數組。

import numpy as np arr1 = np.array(range(10)) arr2 = np.array([[1,2,3],[4,5,6]]) arr3 = np.array([[1,2,3],['a','b','c']]) arr4 = np.array([[1,2,3],['a','b']]) print(arr1) print(arr2) print(arr3) print(arr4)
2.通過numpy的arange(start,stop,step=1,dtype)創建一維數組
start表示起始值,stop表示終止值(包含start但不包含stop,即前閉后開區間),step表示步長默認為1,dtype表示元素類型,其中stop和step可省略。
arr5 = np.arange(5) #[0 1 2 3 4] arr6 = np.arange(1.0,6) #[1. 2. 3. 4. 5. ] arr7 = np.arange(1.0,6,dtype = int) #[1 2 3 4 5] arr8 = np.arange(1,8,2) #[1 3 5 7]
3.通過reshape(m,n)創建
如下示例表示創建10個0-1之間的隨機數,然后生成一個二維數組,每個數組5個元素。
arr = np.random.rand(10).reshape(2,5) print(arr) # [[0.03377643 0.17232537 0.55157918 0.96107258 0.50468264] # [0.85299258 0.50271173 0.31466024 0.89302 0.82547851]]
4.通過linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None)創建一維數組
start:起始值
stop:終止值,默認包含stop
num:數組元素的個數,默認為50個
endpoint:數組是否包含stop,默認為true包含,false表示不包含
retstep:數組是否顯示步長,默認為false不顯示,只顯示數組;true表示結果顯示為一個元組,元組的第一個元素為數組第二個元素為步長
dtype:數組元素的類型
arr1 = np.linspace(1,5,num=5) #[1. 2. 3. 4. 5.] arr2 = np.linspace(1,6,num=5,endpoint=False,retstep=True,dtype=int) #(array([1, 2, 3, 4, 5]), 1.0)
5.通過zeros(shape,dtype=float)和zeros_like(arr,dtype)創建元素全部為0的多維數組
zeros()表示創建一個數組,緯度為參數shape,元素全部為0且默認類型為float
zeros_like()表示創建一個類似參數arr結構的數組,元素全部為0,元素類型默認與arr保持一致,也可自定義元素類型。

arr1 = np.zeros(3) arr2 = np.zeros([3,2],dtype = int) arr3 = np.zeros_like(arr1,dtype = int) print(arr1) print(arr2) print(arr3) # [0. 0. 0.] # [[0 0] # [0 0] # [0 0]] # [0 0 0]
6.通過ones(shape,dtype=float)和ones_like(arr,dtype)創建元素全部為1的多維數組
ones()和ones_like()的用法類似zeros()和zeros_like()的用法,只是數組的元素的值為1。

arr1 = np.ones(2) arr2 = np.ones((2,3),dtype = int) arr3 = np.ones_like(arr1,dtype = int) print(arr1) print(arr2) print(arr3) # [1. 1.] # [[1 1 1] # [1 1 1]] # [1 1]
7.通過eye(n,dtype = float)創建多維數組
eye()表示創建n*n的數組,對角線元素為1其他元素為0,默認元素類型為float。

arr1 = np.eye(2) arr2 = np.eye(3,dtype = int) print(arr1) print(arr2) # [[1. 0.] # [0. 1.]] # [[1 0 0] # [0 1 0] # [0 0 1]]
二、數組常用屬性
- type(arr) 數組類型
- arr.ndim 數組的秩,即軸的數量或緯度的數量
- arr.shape 數組的形狀,形式為(m,n),對於二位數組來說m表示行n表示列
- arr.size 數組元素的總個數,相當於shape中的m*n
- arr.dtype 數組元素的類型
- arr.itemsize 數組元素的大小,單位為字節
- arr.data 實際數組元素的緩沖區

arr = np.array(([1,2,3],[4,5,6])) print(type(arr)) #<class 'numpy.ndarray'> print(arr.ndim) #2 print(arr.shape) #(2, 3) print(arr.size) #6 print(arr.dtype) #int32 print(arr.itemsize)# 4 print(arr.data) #<memory at 0x000002DADBB082D0>
三、數組的索引
①數值索引
數組的數值索引類似python列表和元組的索引,從0開始,且切片[m:n]表示包括m但不包括n。
對於嵌套列表和元組來說,可通過l[m][n]獲取第二層的值,在numpy中除了這種方法,還可通過arr[m,n]來獲取,m表示行n表示列。

arr = np.arange(12).reshape(2,2,3) print(arr) print(arr[0][1][1:]) print(arr[1][0][2]) print(arr[1,0,2]) # [[[ 0 1 2] # [ 3 4 5]] # # [[ 6 7 8] # [ 9 10 11]]] # [4 5] # 8 # 8
②布爾索引
使用布爾索引時,False表示不保留,True表示保留,如下例子h表示在水平方向的索引規則,即保留第二行,v表示在豎直方向的索引規則,保留第一列和第三列。

arr = np.arange(12).reshape(3,4) h = np.array([False,True,False]) v = np.array([True,False,True,False]) print(arr) print(arr[h]) print(arr[:,v]) print(arr[h,v]) # [[ 0 1 2 3] # [ 4 5 6 7] # [ 8 9 10 11]] # [[4 5 6 7]] # [[ 0 2] # [ 4 6] # [ 8 10]] # [4 6]

arr = np.arange(12).reshape(2,6) m = (arr>8) n = (arr<3) print(m) print(n) print(arr[m]) print(arr[n]) # [[False False False False False False] # [False False False True True True]] # [[ True True True False False False] # [False False False False False False]] # [ 9 10 11] # [0 1 2]
四、數組常用方法
1..T轉置
.T會對原數組進行轉置操作,一維數組轉置后的結果與原數組相同。
.T會生成新的數組,修改原數組會影響轉置后的數組,修改轉置后的數組也會影響原數組,即兩者指向相同的內存地址。

arr1 = np.arange(5) print(arr1) arr2 = arr1.T print(arr2) arr1[1]=10 arr2[3]=30 print(arr1,arr2) arr3 = np.array([[1,2,3],[4,5,6]]) print(arr3) arr4 = arr3.T print(arr3) print(arr4) arr3[0][0]=10 print(arr3) print(arr4) arr4[1][0]=20 print(arr3) print(arr4) # [0 1 2 3 4] # [0 1 2 3 4] # [ 0 10 2 30 4] [ 0 10 2 30 4] # [[1 2 3] # [4 5 6]] # [[1 2 3] # [4 5 6]] # [[1 4] # [2 5] # [3 6]] # [[10 2 3] # [ 4 5 6]] # [[10 4] # [ 2 5] # [ 3 6]] # [[10 20 3] # [ 4 5 6]] # [[10 4] # [20 5] # [ 3 6]]
2.reshape()重置維度
兩種用法:np.reshape(arr,shape)和arr.reshape(m,n),reshape()要求重置后的元素個數與原數組相同,否則會報錯。
reshape()兩種方法都會生成新的數組,修改原數組會影響重置維度后的數組,修改重置維度后的數組也會影響原數組,即兩者指向相同的內存地址。

arr1 = np.ones((3,2),dtype = int) print(arr1) arr2 = np.reshape(arr1,[2,3]) #xin print(arr2) arr3 = arr1.reshape(2,3) #yuan print(arr1) print(arr2) print(arr3) arr1[0][0] = 10 arr2[0][1] = 20 arr3[0][2] = 30 print(arr1) print(arr2) print(arr3) # [[1 1] # [1 1] # [1 1]] # [[1 1 1] # [1 1 1]] # [[1 1] # [1 1] # [1 1]] # [[1 1 1] # [1 1 1]] # [[1 1 1] # [1 1 1]] # [[10 20] # [30 1] # [ 1 1]] # [[10 20 30] # [ 1 1 1]] # [[10 20 30] # [ 1 1 1]]
3.resize()重置大小
兩種用法:np.resize(arr,shape)和arr.resize(m,n),但是resize()的效果與轉置和重置維度不同。
np.resize(arr,shape)會生成新的數組,修改原數組不會影響重置大小后的數組,修改重置大小后的數組也不會影響原數組,即兩者是獨立的。
arr.resize(m,n)直接重置arr自身的大小,不會生成新的數組。

arr1 = np.ones((3,2),dtype = int) print(arr1) arr2 = np.resize(arr1,[2,3]) print(arr2) arr3 = arr1.resize(2,3) print(arr1) print(arr2) print(arr3) arr1[0][0] = 0 arr2[1][0] = 0 print(arr1) print(arr2) print(arr3) # [[1 1] # [1 1] # [1 1]] # [[1 1 1] # [1 1 1]] # [[1 1 1] # [1 1 1]] # [[1 1 1] # [1 1 1]] # None # [[0 1 1] # [1 1 1]] # [[1 1 1] # [0 1 1]] # None
resize()不要求重置后的元素個數與原數組相同
如果重置大小后的數組元素個數比原數組少,會從原數組前開始部分取值,舍去多余的元素;
如果重置大小后的數組元素個數比原數組多,多的元素會再依次從原數組開始部分取值,直到元素個數滿足要求。

arr4 = np.arange(5) arr5 = np.resize(arr4,(2,2)) arr6 = np.resize(arr4,(2,4)) print(arr4) print(arr5) print(arr6) # [0 1 2 3 4] # [[0 1] # [2 3]] # [[0 1 2 3] # [4 0 1 2]]
4.copy()復制
使用=給數組賦值,兩者指向相同的內存地址,修改任一個會影響另一個。
使用copy()給數組賦值,兩者是獨立的數組,修改任一個不會影響另一個。

arr1 = np.arange(5) arr2 = arr1 arr3 = arr1.copy() print(arr1,arr2,arr3) arr1[1] = 10 arr2[2] = 20 arr3[3] = 30 print(arr1,arr2,arr3) # [0 1 2 3 4] [0 1 2 3 4] [0 1 2 3 4] # [ 0 10 20 3 4] [ 0 10 20 3 4] [ 0 1 2 30 4]
5.astype()數據類型轉換
arr1 = np.arange(5) arr2 = arr1.astype(np.float) print(arr1,arr1.dtype) print(arr2,arr2.dtype) # [0 1 2 3 4] int32 # [0. 1. 2. 3. 4.] float64
6.hstack()和vstack()數組堆疊
hstack((arr1,arr2)):橫向堆疊,即在水平方向上拼接
vstack((arr1,arr2)):豎向堆疊,即在垂直方向上拼接,垂直拼接要求兩個數組橫向元素的個數相同,即shape(m,n)中的n相同

arr1 = np.arange(1,6) arr2 = np.arange(6,11) print(arr1,arr2) print(np.hstack((arr1,arr2))) print(np.vstack((arr1,arr2))) print(np.stack((arr1,arr2))) #默認axis = 0 print(np.stack((arr1,arr2),axis=1)) # [1 2 3 4 5] [ 6 7 8 9 10] # [ 1 2 3 4 5 6 7 8 9 10] # [[ 1 2 3 4 5] # [ 6 7 8 9 10]] # [[ 1 2 3 4 5] # [ 6 7 8 9 10]] # [[ 1 6] # [ 2 7] # [ 3 8] # [ 4 9] # [ 5 10]]
7.hsplit()和vsplit()數組拆分
hsplit(arr , x):橫向拆分為x個,即在水平方向上拆分,水平拆分要求原數組橫向元素的個數為x的整數倍,即shape(m,n)中的n為x的整數倍
vsplit(arr , x):豎向拆分為x個,即在垂直方向上拆分,垂直拆分要求原數組垂直元素的個數為x的整數倍,即shape(m,n)中的m為x的整數倍

arr1 = np.arange(12).reshape(2,6) print(arr1) print(np.hsplit(arr1,3)) arr2 = np.arange(12).reshape(4,3) print(arr2) print(np.vsplit(arr2,2)) # [[ 0 1 2 3 4 5] # [ 6 7 8 9 10 11]] # [array([[0, 1], # [6, 7]]), array([[2, 3], # [8, 9]]), array([[ 4, 5], # [10, 11]])] # [[ 0 1 2] # [ 3 4 5] # [ 6 7 8] # [ 9 10 11]] # [array([[0, 1, 2], # [3, 4, 5]]), array([[ 6, 7, 8], # [ 9, 10, 11]])] #
8.算數運算
①數組與單個數值進行數學運算
加、減、乘、除和冪運算都是對數組中的每一個元素進行運算。
arr = np.arange(2,12,2) print(arr) #[ 2 4 6 8 10] print(arr + 1) # 加法 [ 3 5 7 9 11] print(arr - 1) # 減法 [1 3 5 7 9] print(arr*2) # 乘法[ 4 8 12 16 20] print(arr**2) # 冪運算[ 4 16 36 64 100] print(arr/2) # 除法 [1. 2. 3. 4. 5.] print(arr.max()) # 元素中的最大值 10 print(arr.min()) # 元素中的最小值 2 print(arr.mean()) # 元素的平均值 6.0 print(arr.sum(),np.sum(arr)) # 元素的總和 30 30 print(arr.std()) # 元素的標准差 2.8284271247461903 print(arr.var()) # 元素的方差 8.0
②數組之間的數學運算
如果兩個數組緯度相同,即arr1.shape = arr2.shape,他們之間的數學運算就是每一個對應的元素進行運算,如果形狀不同,則會觸發廣播機制,具體見菜鳥教程https://www.runoob.com/numpy/numpy-broadcast.html
五、隨機數
1.random.normal()
生成[0,1)之間標准正態分布的隨機浮點數,無參數生成一個隨機數,有參數需要用括號括起來。

arr1 = np.random.normal() arr2 = np.random.normal(size = 2) arr3 = np.random.normal(size = (2,3)) print(arr1) print(arr2) print(arr3) # 1.1511731857477647 # [1.00477836 1.88009993] # [[ 0.44901815 -1.09567036 -0.29054339] # [-0.98372232 0.40854306 1.63187907]]
2.random.rand()
生成[0,1)之間的均勻分布的隨機浮點數,無參數生成一個隨機數,有參數直接使用(m,n)即可

arr1 = np.random.rand() arr2 = np.random.rand(2) arr3 = np.random.rand(2,3) print(arr1) print(arr2) print(arr3) # 0.583667212009531 # [0.15508024 0.23161194] # [[0.11583745 0.92588869 0.69102494] # [0.49288564 0.42045576 0.42541661]]
3.random.randn()
生成正態分布的隨機浮點數,大小無限制,無參數生成一個隨機數,有參數直接使用(m,n)即可

arr1 = np.random.randn() arr2 = np.random.randn(2) arr3 = np.random.randn(2,3) print(arr1) print(arr2) print(arr3) # 2.263955408625279 # [ 0.15676236 -0.15578064] # [[ 2.30273663 -0.75283754 -0.46872555] # [-1.14051476 1.51395796 -1.39675718]]
4.random.randint()
使用方法random.randint(start,stop,shape,dtype)
生成的數組緯度為參數shape,緯度默認為1,
如果start和stop都存在則start<= 元素 <stop且要求start < stop,如果只傳入一個參數則0 <= 元素 < 參數

arr1 = np.random.randint(5) #生成一個隨機整數,范圍在[0,5)之間 arr2 = np.random.randint(0,10) #生成一個隨機整數,范圍在[0,10)之間 arr3 = np.random.randint(0,10,5) #生成一個包含5個元素的一維數組,元素范圍在[0,10)之間 arr4 = np.random.randint(0,10,[2,5])#生成一個2行、5列的二維數組,元素范圍在[0,10)之間 print(arr1) print(arr2) print(arr3) print(arr4) # 4 # 8 # [4 7 6 3 9] # [[4 7 4 7 1] # [2 0 8 9 3]]
5.random.uniform()
使用方法random.uniform(min,max,shape),均勻生成形狀為shape、大小介於min和max之間的數組

arr1 = np.random.uniform(-5,5) arr2 = np.random.uniform(-5,5,10) arr3 = np.random.uniform(-5,5,(2,5)) print(arr1) print(arr2) print(arr3) # 1.4332287676136222 # [-3.80524427 -2.12707058 0.0591455 1.00699272 -0.18934898 -4.66894326 -1.44132482 2.80757844 -0.2869196 -4.83401471] # [[-3.01349008 -0.28137982 1.40406868 -4.71398305 -0.58511982] # [-1.62481178 3.24231459 0.10724101 -1.99657278 -2.8664592 ]]
6.random.RandomState(n)
上述幾種生成隨機數的方法,如果直接使用,即使是同一個程序,每次運行都會生成不同的隨機數。
使用rng = np.random.RandomState(n)生成隨機數種子,再通過種子rng去調用normal()、rand()、randn()、randint()。
參數n表示使用第幾套種子,對於一個隨機數發生器,只要種子相同,生成的隨機數序列總是相同的。
六、寫入和讀取文件
1.save()和load()
使用方法:save('文件名',arr),load('文件名'),文件類型為.npy
save()保存的文件默認后綴名.npy,如果傳入的文件名以.npy結尾那么保存的文件名即為傳入的文件名,如果不以.npy結尾保存時會自動在文件名后加后綴.npy
由於save()保存的文件類型為npy,因此直接打開會顯示為亂碼,需要通過load()查看內容。

arr = np.random.randint(0,5,[2,5]) np.save('testNumpy.npy',arr) arr_load = np.load('testNumpy.npy') print(arr_load) # [[0 0 1 4 2] # [2 3 4 2 0]]
2.savetxt()和loadtxt()
使用方法:savetxt('文件名',arr,delimiter=',',fmt='%.2f'),loadtxt('textNumpy.text',delimiter=','),其中delimiter指定txt文件中元素的分隔符,fmt指定數值保留的格式。

arr = np.random.rand(10,10) np.savetxt('textNumpy.text',arr,delimiter=',',fmt='%.2f') arr_load = np.loadtxt('textNumpy.text',delimiter=',') print(arr_load)
由於保存的文件為txt類型,因此生成的文件可以直接打開,文件內以指定的delimiter保存數據,無數組的[ ],通過loadtxt( )可讀取。