Pandas 基礎(3) - 生成 Dataframe 的幾種方式


這一節想總結一下 生成 Dataframe 的幾種方式:

  1. CSV
  2. Excel
  3. python dictionary
  4. List of tuples
  5. List of dictionary

下面分別一一介紹具體的實現方式:

  • 通過 csv 文件
    這里補充一個知識點, 就是如果要讀取的文件不在 jupyter 所在的文件夾, 則可以通過絕對路徑的方式引入.
df = pd.read_csv("/Users/rachel/Downloads/weather.csv") 
  • 通過 Excel 文件
    這里的第二個參數是必填項, 因為要指明具體讀取 excel 表中的哪個 sheet.
df = pd.read_excel("/Users/rachel/Downloads/weather.xlsx", "weather") 

還有一個小坑, 就是在初次運行的時候有可能會提示錯誤, 根據錯誤提示, 大概可以了解到, 要讀取 excel 文件, 還需要一個 xlrd 的包, 在終端運行下面命令就好了

pip3 install xlrd
  • 通過 python dictionary (為了方便大家日后可以更好地理解英文文檔, 這里的一些專業名詞, 我就都不翻譯了)
weather_data = { 'day': ['1/1/2017','1/2/2017','1/3/2017'], 'temperature': [32,35,28], 'windspeed': [6,7,2], 'event': ['Rain', 'Sunny', 'Snow'] } df = pd.DataFrame(weather_data) 
  • 通過 List of tuples
weather_data = [ ('1/1/2017',32,6,'Rain'), ('1/2/2017',35,7,'Sunny'), ('1/3/2017',28,2,'Snow') ] df = pd.DataFrame(data=weather_data, columns=['day','temperature','windspeed','event']) 

上面例子中, weather_data 的數據結構是一個 list(特點是中括號), list 中的每一個元素就是一個 tuple, 由於原數據沒有指明列名, 所以在創建 dataframe 的時候, 需要指明列名.

  • 通過 List of dictionary, 從名字就可以讀出來下面的數據結構是一個 list, list 中的每個元素又是一個 dictionary.
weather_data = [ {'day': '1/1/2017', 'temperature': 32, 'windspeed': 6, 'event': 'Rain'}, {'day': '1/2/2017', 'temperature': 35, 'windspeed': 7, 'event': 'Sunny'}, {'day': '1/3/2017', 'temperature': 28, 'windspeed': 2, 'event': 'Snow'}, ] df = pd.DataFrame(data=weather_data, columns=['day','temperature','windspeed','event']) 

上面簡要介紹了 5 中生成 dataframe 的方式, 其實 Pandas 還支持很多種文件格式的輸入輸出, 具體可以參考下官方文檔 https://pandas.pydata.org/pandas-docs/version/0.22/io.html

有任何問題或意見, 歡迎留言交流哦~~~


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM