numpy 中的文件操作總結
CVS文件
CSV (Comma‐Separated Value,逗號分隔值),是一種常見的文件格式,用來存儲批量數據
存儲:
np.savetxt(frame, array, fmt='%.18e', delimiter=None)
frame: 文件、字符串或產生器,可以是.gz或.bz2的壓縮文件array: 存入文件的數組fmt: 寫入文件的格式,例如:%d %.2f %.18edelimiter: 分割字符串,默認是任何空格
a = np.arange(50).reshape(5,10)
np.savetxt("a.cvs", a, fmt = "%d", delimiter=",")
讀取:
np.loadtxt(frame, dtype=np.float, delimiter=None,unpack=False)
frame: 文件、字符串或產生器,可以是.gz或.bz2的壓縮文件dtype: 數據類型,可選delimiter: 分割字符串,默認是任何空格unpack: 如果True,讀入屬性將分別寫入不同變量
b = np.loadtxt("a.cvs", dtype = np.int, delimiter = ",")
CSV只能有效存儲一維和二維數組
np.savetxt(), np.loadtxt()只能有效存取一維和二維數組
多維數據的存取
存儲:
a.tofile(frame, sep='', format='%s')
frame: 文件、字符串sep: 數據分割字符串,如果是空串,寫入文件為二進制format: 寫入數據的格式
a = np.array(50).reshape(5,5,2)
a.tofile("b.bat", sep = ",", format = "%d")
讀取:
np.fromfile(frame, dtype=np.float, count=‐1, sep='')
frame: 文件、字符串dtype: 讀取的數據類型count: 讀入元素個數,‐1表示讀入整個文件sep: 數據分割字符串,如果是空串,寫入文件為二進制
c = np.fromfile('b.bat', dtype = np.int, sep = ',')
c
array([0,1,2,3,...,49])
c = np.fromfile('b.bat', dtype = np.int, sep = ',').reshape(5,5,2)
注意:該方法需要讀取時知道存入文件時數組的維度和元素類型,
a.tofile()和np.fromfile()需要配合使用 可以通過元數據文件來存儲額外信息
numpy 的便捷文件存取
np.save(fname, array) 或 np.savez(fname, array)
fname: 文件名,以.npy為擴展名,壓縮擴展名為.npzarray: 數組變量
np.load(fname)
fname: 文件名,以.npy為擴展名,壓縮擴展名為.npz
a = np.array(50).reshape(5,5,2)
np.save("a.npy", a)
b = np.load('a.npy')
