http://blog.csdn.net/u014374284/article/details/45420645
一、NumPy簡介
NumPy的全名為Numeric Python,是一個開源的Python科學計算庫,它包括:
- 一個強大的N維數組對象ndrray;
- 比較成熟的(廣播)函數庫;
- 用於整合C/C++和Fortran代碼的工具包;
- 實用的線性代數、傅里葉變換和隨機數生成函數
NumPy的優點:
- 對於同樣的數值計算任務,使用NumPy要比直接編寫Python代碼便捷得多;
- NumPy中的數組的存儲效率和輸入輸出性能均遠遠優於Python中等價的基本數據結構,且其能夠提升的性能是與數組中的元素成比例的;
- NumPy的大部分代碼都是用C語言寫的,其底層算法在設計時就有着優異的性能,這使得NumPy比純Python代碼高效得多
當然,NumPy也有其不足之處,由於NumPy使用內存映射文件以達到最優的數據讀寫性能,而內存的大小限制了其對TB級大文件的處理;此外,NumPy數組的通用性不及Python提供的list容器。因此,在科學計算之外的領域,NumPy的優勢也就不那么明顯。
二、數組ndarray
NumPy最重要的一個特點就是其N維數組對象(即ndarray),該對象是一個快速而靈活的大數據集容器,該對象由兩部分組成:
- 實際的數據;
- 描述這些數據的元數據;
大部分的數組操作僅僅是修改元數據部分,而不改變其底層的實際數據。數組的維數稱為秩,簡單來說就是如果你需要獲取數組中一個特定元素所需的坐標數,如a是一個2×3×4的矩陣,你索引其中的一個元素必須給定三個坐標a[x,y,z],故它的維數就是3。而軸可以理解為一種對數組空間的分割,以數組a為例,如果我們以0為軸,那么a可以看成是一個由兩個元素構成的數組,其中每個元素都是一個3×4的數組。
我們可以直接將數組看作一種新的數據類型,就像list、tuple、dict一樣,但數組中所有元素的類型必須是一致的,Python支持的數據類型有整型、浮點型以及復數型,但這些類型不足以滿足科學計算的需求,因此NumPy中添加了許多其他的數據類型,如bool、inti、int64、float32、complex64等。同時,它也有許多其特有的屬性和方法。
常用ndarray屬性:
- dtype 描述數組元素的類型
- shape 以tuple表示的數組形狀
- ndim 數組的維度
- size 數組中元素的個數
- itemsize 數組中的元素在內存所占字節數
- T 數組的轉置
- flat 返回一個數組的迭代器,對flat賦值將導致整個數組的元素被覆蓋
- real/imag 給出復數數組的實部/虛部
- nbytes 數組占用的存儲空間
常用ndarray方法:
- reshape(…) 返回一個給定shape的數組的副本
- resize(…) 返回給定shape的數組,原數組shape發生改變
- flatten()/ravel() 返回展平數組,原數組不改變
- astype(dtype) 返回指定元素類型的數組副本
- fill() 將數組元素全部設定為一個標量值
- sum/Prod() 計算所有數組元素的和/積
- mean()/var()/std() 返回數組元素的均值/方差/標准差
- max()/min()/ptp()/median() 返回數組元素的最大值/最小值/取值范圍/中位數
- argmax()/argmin() 返回最大值/最小值的索引
- sort() 對數組進行排序,axis指定排序的軸;kind指定排序算法,默認是快速排序
- view()/copy() view創造一個新的數組對象指向同一數據;copy是深復制
- tolist() 將數組完全轉為列表,注意與直接使用list(array)的區別
- compress() 返回滿足條件的元素構成的數組
