Pandas
是我最喜愛的庫之一。通過帶有標簽的列和索引,Pandas
使我們可以以一種所有人都能理解的方式來處理數據。它可以讓我們毫不費力地從諸如 csv
類型的文件中導入數據。我們可以用它快速地對數據進行復雜的轉換和過濾等操作。Pandas
真是超級棒。
我覺得它和 Numpy
、Matplotlib
一起構成了一個 Python 數據探索和分析的強大基礎。Scipy
當然也是一大主力並且是一個絕對贊的庫,但是我覺得前三者才是 Python 科學計算真正的頂梁柱。
那么,趕緊看看 python 科學計算系列的第三篇推文,一窺 Pandas
的芳容吧。如果你還沒看其它幾篇文章的話,別忘了去看看。
導入 Pandas
第一件事當然是請出我們的明星 —— Pandas。
from pandas import Series, DataFrame import pandas as pd
這是導入 pandas
的標准方法。我們不想一直寫 pandas
的全名,但是保證代碼的簡潔和避免命名沖突都很重要,所以折中使用 pd
。如果你去看別人使用 pandas
的代碼,就會看到這種導入方式。
Pandas 中的數據類型