Python數據分析


一、Python概述

  Python與Excel對比。

    Excel:1.具備強大的功能,但面對大量的數據,處理麻煩,處理速度無法滿足需求。

         2.Excel停留在描述性分析階段,例如:對比分析,趨勢分析,結構分析等。

    Python:1.Python語言強大而靈活,通過編寫代碼具有不同的功能,比Excel功能更強大。比如專業的統計分析,數據挖掘分析,預測分析等。

    數據對比

    Excel主要處理規律可循或者明顯的數據。

    Python能夠處理雜亂、無規律的數據。比如提出數據的關鍵詞。

    流程對比

    

    簡單易學。

 二、NumPy——第三方擴展庫

       概述

         1.是Python數組計算、矩陣計算和科學計算的核心庫。

       2.NumPy提供一個高性能的數組對象,讓我們輕松創建一維數組、二維數組和多維數組,以及大量的函數和方法。

    使用NumPy的原因

        對於數值計算任務,使用NumPy要比直接編寫Python代碼快捷得多。

       *NumPy能夠直接對數據和矩陣進行操作,可以省略很多循環語句。

       *NumPy眾多的數學函數能簡化編寫代碼的工作。

    Pandas

      1.專門用於數據分析的開源Python庫。

      2.Python核心數據分析庫,能夠處理各類數據。

        例:*與SQL或Excel表格類似的數據。

          *有序和無序(非固定頻率)的時間序列數據。即有無規律

          *帶行列標簽的矩陣數據。

          *任意其他形式的觀測、統計數據集。

      3.優勢

          *處理浮點與非浮點數據的缺失數據。用NAN代替顯示缺失。

          *大小可變,例如插入或刪除DataFrame等多維對象的列。

          *自動、顯式的數據對齊,顯式地將對象與一組標簽對齊。

          *強大、靈活的分組統計功能,即數據聚合、數據轉換。

          *靈活地合並、連接、重塑、透視數據集。

          *成熟的導入導出工具。

          *時間序列。——日期范圍生成,頻率轉換等

三、Matplotlib

      1.簡介

        是一個Python 2D 繪圖庫,是Python 2D 繪圖領域使用最廣泛的套件。能讓使用者輕松地將數據圖形化,並且提供多樣化的輸出格式。

        只需幾行代碼就可以繪制各種折線圖、餅圖等。

      2.繪制圖表

          *基礎圖表:直方圖——反映數據分布,x軸為定類數據。等

          *高級圖表:堆疊柱形圖等

          *3D圖表

      3.優點

          *免費

          *繼承Python語法的優點。

          *可借助Python強大的拓展模塊嵌入在圖形用戶界面應用程序中,也可以嵌入在網頁中。

    使用

      1.導入快速繪圖的函數庫——pyplot子庫。(plt)

        pyplot是Matplotlib的子庫,該子庫可以快速繪制 2D 圖表。使用 import 語句導入plt 。

      代碼:import matplotlib.pylot as plt

      2.繪制圖表,代碼如下:

      

      3.保存和顯示圖表——show函數

        代碼:plt.show()


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM