python科學計算和數據分析常用庫


  1. NumPy
    NumPy最強大的是n維數組,該庫還包含基本的線性代數函數、傅立葉變換、隨機函數和其他底層語言(如Fortran、C和C++)集成的工具。
  2. SciPy
    SciPy建立在NumPy基礎上,它是離散傅立葉變換、線性代數、優化和稀疏矩陣等多種高級科學和工程模塊最有用的庫之一。
  3. Matplotlib
    Matplotlib主要用於繪制各種各樣的圖形,從直方圖到線圖、熱力圖,還可以使用Latex命令在圖像中添加數學符號。
  4. Pandas
    Pandas主要用於結構化數據的運算和操作,廣泛用於數據整理和預處理,其有助於提高Python在數據科學社區的使用。
  5. Scikit
    Scikit主要用於機器學習,該庫建立在NumPy、SciPy和matplotlib基礎上,包含許多有效的機器學習和統計建模工具,如分類、回歸、聚類和降維。
  6. Statsmodels
    Statsmodels用於統計建模。Statsmodels是一個Python中提供用戶探索數據、估計統計模型和執行統計測試的模組。可用於不同類型數據的描述性統計,統計測試,繪圖功能和結果統計。
  7. Seaborn
    Seaborn用於數據可視化。Seaborn是一個用於在Python中制作有吸引力和翔實的統計圖形庫。它是基於matplotlib。Seaborn旨在使可視化成為探索和理解數據的核心組成。
  8. Bokeh
    Bokeh用於在現代網絡瀏覽器上創建交互式圖表,儀表盤和數據應用程序。它賦予用戶以D3.js的風格生成優雅簡潔的圖形。此外,它具有超大型或流式數據集的高性能交互能力。
  9. Blaze
    Blaze將Numpy和Pandas的能力擴展到分布式和流式傳輸數據集。它可以用於從眾多來源(包括Bcolz,MongoDB,SQLAlchemy,Apache Spark,PyTables等)訪問數據。與Bokeh一起,Blaze可以作為在巨型數據塊上創建有效可視化和儀表盤的強大的工具。
  10. Scrapy
    Scrapy用於網絡爬蟲。它是獲取特定模式數據的非常有用的框架。它從網站首頁url開始,然后挖掘網站內的網頁內容來收集信息。
  11. SymPy
    SymPy用於符號計算。它具有從基本算術符號到微積分,代數,離散數學和量子物理學的廣泛能力。另一個有用的功能是將計算結果格式化為LaTeX代碼。
  12. Requests
    Requests用於web訪問。它類似於標准python庫urllib2,但是代碼更容易。你會發現與urllib2的微妙差異,但是對於初學者來說,Requests可能更方便。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM