在c語言中,我們可以使用關鍵字struct定義結構類型。和c語言一樣,numpy也可以創建結構定義,這樣可以很方便的讀取二進制的C語言結構數組,將其轉換為numpy數組對象,假設我們定義的結構數組如下(C語言描述):
struct Person{ char name[30]; int age; float weight; };
我們在python中可以自定義類型如下:
>>> persontype = np.dtype({ 'names':['name','age','weight'], 'formats':['S30','i','f']},align = True)
>>> a = np.array([('Liming',24,63.9),('Mike',15,67.),('Jan',34,45.8)],dtype = persontype)
>>> a
array([('Liming', 24, 63.900001525878906), ('Mike', 15, 67.0),
('Jan', 34, 45.79999923706055)],
dtype={'names':['name','age','weight'], 'formats':['S30','<i4','<f4'], 'offsets':[0,32,36], 'itemsize':40, 'aligned':True})
首先創建了dtype對象persontype,它的結構類型是一個藐視各字段的字典,該字典有兩個鍵:‘names’和'format'.每個鍵對應的值是一個列表,‘names’定義結構體中每個字段的名稱,'formats’定義每個字段的數據類型。我們使用的類型如下:
‘S30’:表示長度為30的字符串類型,由於結構體中每個元素的大小固定,所以需要指定長度。
‘i’:32位的整數類型,相當於np.int32
'f':32位單精度浮點數,相當於np.float32
然后通過np.array()創建數組,通過dtype指定元素類型為persontype
還可以使用包含該多個元組的列表來描述數據類型,刑如:(字段名,數據類型)
>> persontype = np.dtype([('name','|S30'),('age','<i8'),('weight','<f8')]) >>> a = np.array([('Liming',24,63.9),('Mike',15,67.),('Jan',34,45.8)],dtype = persontype) >>> a array([('Liming', 24L, 63.9), ('Mike', 15L, 67.0), ('Jan', 34L, 45.8)], dtype=[('name', 'S30'), ('age', '<i8'), ('weight', '<f8')])
|:忽略字節順序
<:低位字節在前
>:高位字節在前
結構體數組的取值方式和一般數組差不多,可以通過下標取得元素:
>>> a[0] ('Liming', 24L, 63.9) >>> a[0:-1] array([('Liming', 24L, 63.9), ('Mike', 15L, 67.0)], dtype=[('name', 'S30'), ('age', '<i8'), ('weight', '<f8')])
我們可以使用字段名作為下標獲取對於的值
>>> a['name'] array(['Liming', 'Mike', 'Jan'], dtype='|S30') >>> a['age'] array([24, 15, 34], dtype=int64) >>> a['weight'] array([ 63.9, 67. , 45.8])
可以通過 a.tostring()或者a.tofile()方法可以將數組a以二進制方式寫成字符串或者寫入文件