1.IPython——科學計算標准工具集的組成部分
(1)是一個增強Python shell,目的是提高編寫,測試,調試python的速度
(2)主要用於交互式數據並行處理,是分布式計算的基礎架構
(3) 提供了一個類似於Mathematica的HTML筆記本,一個基於Qt框架的GUI控制台,具有繪圖、多行編輯以及語法高亮。
2.Numpy數據分析——科學計算的基礎包
(1)快速高效多維的數組對象ndarray
(2)對數組執行元素級的計算以及直接對數組執行數學運算的函數
(3)讀寫硬盤上基於數組的數據集的工具
(4)線性代數運算,傅里葉變換,以及隨機數生成
(5)將C、C++、Fortran代碼集成到python
3.scipy——專門解決科學計算中各種標准問題域的模塊的集合
SciPy 主要包含了 8 個模塊,不同的子模塊有不同的應用,如插值、積分、優化、圖像處理和特殊函數等。
scipy.integrate 數值積分例程和微分方程求解器
scipy.linalg 擴展了由 numpy.linalg 提供的線性代數例程和矩陣分解功能
scipy.optimize 函數優化器(最小化器)以及根查找算法
scipy.signal 信號處理工具
scipy.sparse 稀疏矩陣和稀疏線性系統求解器
scipy.special SPECFUN(這是一個實現了許多常用數學函數的 Fortran 庫)的包裝器
scipy.stats 檢驗連續和離散概率分布、各種統計檢驗方法,以及更好的描述統計法
scipy.weave 利用內聯 C++代碼加速數組計算的工具
4. Pandas——數據分析核心庫
提供了一系列能夠快速、便捷地處理結構化數據的數據結構和函數。
高性能的數組計算功能以及電子表格和關系型數據庫(如 SQL)靈活的數據處理功能。
復雜精細的索引功能,以便便捷地完成重塑、切片和切塊、聚合及選取數據子集等操作。
5.Matplotlib——繪制數據圖表的python庫
Python的2D繪圖庫,非常適合創建出版物上用的圖表。
操作比較容易,只需幾行代碼即可生成直方圖、功率譜圖、條形圖、錯誤圖和散點圖等圖形。
提供了pylab的模塊,其中包括了NumPy和pyplot中許多常用的函數,方便用戶快速進行計算和繪圖。
交互式的數據繪圖環境,繪制的圖表也是交互式的
6.Scikit-learn ——數據挖掘和數據分析工具
簡單有效,可以供用戶在各種環境下重復使用。
封裝了一些常用的算法方法。
基本模塊主要有數據預處理、模型選擇、分類、聚類、數據降維和回歸 6 個,在數據量不大的情況下,scikit-learn可以解決大部分問題。
7.Spyder——交互式python語言開發環境
提供高級的代碼編輯、交互測試和調試等特性。
包含數值計算環境。
可用於將調試控制台直接集成到圖形用戶界面的布局中。
模仿MATLAB的“工作空間”,可以很方便地觀察和修改數組的值。