
Pandas這個庫對Python來說太重要啦!因為它的出現,讓Python進行數據分析如虎添翼,作為Python里面最最牛逼的庫之一,它在數據處理和數據分析方面,擁有極大的優勢,受到數據科學開發者的廣大歡迎。
最近在逛GitHub的時候,發現了一款神器,一款神器分析Pandas DataFrames的圖形化界面,可以幫助我們對數據集進行可視化的處理,非常不錯!
GitHub地址:https://github.com/adamerose/pandasgui

01 如何安裝
安裝步驟其安裝步驟十分簡單,只需要使用pip命令安裝即可。
pip3 install pandasgui
#清華鏡像
pip3 install -i https://pypi.tuna.tsinghua.edu.cn/simple pandasgui
建議大家用清華鏡像安裝,這樣會穩定而且快很多。
02 功能特點
PandasGUI是一個交互式的數據操作界面,類似於Excel,但是其對於數據處理更加方便快捷,共擁有7項功能特點:
- 查看DataFrames和Series數據
- 交互式繪圖
- 數據篩選
- 統計摘要
- 數據編輯和復制/粘貼
- 拖放導入CSV文件
- 搜索工具欄
03 使用方式
啟動PandasGUI的方式,代碼也十分簡單,只需要導入相關庫,獲取DataFrames數據並顯示就好了。示例代碼如下:
import pandas as pd
from pandasgui import show
df = pd.read_csv("train.csv")
show(df, setting={'block':True})
然后我們就可以看到一個圖像化的界面了。

04 實戰練習
這次我們拿大名鼎鼎的泰坦尼克數據集來做練習,一起看一下用這款神器如何分析,還是用上面的幾行示例代碼來啟動PandaGui:

在首頁中我們可以看到數據的大小維數(第一個紅框)891*12,以及我們選擇的六個菜單欄:DataFrame,Filters,Statistics,Grapher,Reshaper等,六個菜單欄可以按照自己所需調整到不同區域方便操作。

上圖展示小編將過濾器和統計調整在右邊的畫面,大家可根據需求進行自行調整,下面將對菜單欄分別進行學習操作。
- DataFrame這里對數據進行展示,當我們想要查看數據時,點擊DataFrame便可查看。
- Filters數據篩選這是一個可以根據輸入條件對數據進行初步篩選的交互界面,只需要將條件輸入框中,點擊ADD Filter按鈕即可,在這里,小編輸入了Survived == 1、Age>30、Sex == "male"三個條件,但是之選中了其中兩個條件,其過濾結果如下圖所示。

- Statistics統計菜單欄顯示了數據各個變量之間的統計結果,包含了每個變量的數據類型,總數,平均值,最大值,最小值等。

- Grapher畫圖菜單欄提供了直方圖、散點圖、折線圖、餅狀圖、詞雲等12種圖像格式,用戶可以根據需求選取變量繪制相應的圖形。

下面以直方圖和詞雲為例子向大家進行展示:

上圖繪制了年齡大於30的船上游客的年齡直方圖,可以看到Filter工具在畫圖時仍可以同時使用。

上圖以名字為例子,繪制了船上人員名字的詞雲圖。
- ReshaperReshaper菜單欄展示了了對手機游戲賬號轉讓地圖原始數據進行重新組合為新DataFrames的功能。它包含了DataFrames的基本屬性,實際上代表了DataFrames的兩個方法,df.melt(),df.pivot(),以圖像化的形式進行了展現。這里以pivot進行展示:pivot()參數:values:對應的二維NumPy值數組。columns:列索引:列名稱。index:行的索引:行號或行名。aggfun: 使用方法

上圖中以Sex為行索引,Age為列索引,Fare系統值,操作后的表格展示為:

在上圖中,我們可以看到,在最左邊增加了df_pivot的DataFrames數據,每操作一次,會增加一個DataFrames數據,並在左邊顯示,新增之后的DataFrames數據依然適用於之前所有的操作。此外,新生成的DataFrames可以直接拖拽在文件夾生成新的csv文件,保存方便。
到這里,小編的探索就結束了,有了這個工具,大家就可以像操作Excel一樣操作Dataframe數據,迅速獲取有用的信息,不知道大家有沒有心動呢!
