用Python創建/讀取/導出表格數據文件


一、創建數據集

R語言中創建或導入數據框是非常常見的,只需要一個data.frame的命令就可以了,這個是R語言的基本命令。

我不習慣用Python進行表格式的數據操作和分析,這次和阿雷一起學習如何在Python中使用pandas庫來進行基本的數據框操作。

首先當然是要安裝pandas庫,這個在上一篇文章中已經寫過了,

其次就是要加載這個庫,python中可以使用命令:

1、使用DataFrame()命令,來創建數據框(這個命令的含義是,括號里面的數據類型,捆綁成數據框的形式)

2. 我這里使用的是字典,索引‘a’和‘b’分別可以看成是列名,然后每一列下面的值就是序列,使用命令range生成,也就是值包含了很多值(因為range生成的不只是一個數)

3. 我還想試試字典里面的值不是range,而是列表

經過實踐,這樣也是可以的!! 

4. 在Rstudio這樣的編譯器中,可以很方便地可視化看到我們的數據結構是如何的,這里我們也可以。直接雙擊右側變量管理中的value值,就可以看到啦

這樣一來,我覺得Spyder的編譯器和Studio也很類似,編譯環境變得異常友好起來!

二、外部數據集導入

 學習了如何創建數據集,下面開始學習數據集如何導入。

1. 導入的文件必須是存放在Python當前的路徑

2. 如何查看Python當前的路徑:import os之后,os.getcwd(),也可以使用ios.chdir()更換文件所在路徑

3.使用pd.read_csv('文件名及后綴',encoding = 'dbk') 這里如果你的表格有中文,要加一個參數encoding = 'gbk',如果不是的話,那么就不必了,如果操作系統是MAC的話,就換成utf-8

4.如果是exlce文件,可以使用pd.read_excel('文件名.xlsx',encoding = 'gbk')

 三、數據導出

假設一個數據df2已經存放在了Python環境中,使用df.to_csv('導出后的文件名和后綴'),就可以了

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM