python批量讀取txt文件為DataFrame

本文轉載自查看原文 2017-09-20 14:48 1312 python

我們有時候會批量處理同一個文件夾下的文件，並且希望讀取到一個文件里面便於我們計算操作。比方我有下圖一系列的txt文件，我該如何把它們寫入一個txt文件中並且讀取為DataFrame格式呢？

首先我們要用到glob模塊，這個python內置的模塊可以說是非常的好用。

glob.glob('*.txt')

得到如下結果：

all.txt是我最后得到的結果文件。可以見返回的是一個包含txt文件名稱的列表，當然如果你的文件夾下面只有txt文件，那么你用os.listdir()可以得到一個一樣的列表

然后讀取的時候只要注意txt文件的編碼格式（可以用notepad++打開記事本查看）和間隔符的形式就好了，完整的代碼如下：

import os
import pandas
import codecs
import glob
import pandas as pd


os.getcwd()
os.chdir('D:\AAAASXQ\python study\data preprocessing')

def txtcombine()：
    
    files = glob.glob('*.txt')
    
    all = codecs.open('all.txt','a')
    
    for filename in flist:  
        print(filename)  
        fopen=codecs.open(filename,'r',encoding='utf-8')  
        lines=[]  
        lines=fopen.readlines()  
        fopen.close()  
        i=0  
        for line in lines:    
            for x in line:  
                all.write(x)
        #讀取為DataFrame格式
        all1 = pd.read_csv('all.txt',sep=' ',encoding='GB2312')
        #保存為csv格式
        all1.to_csv('all.csv',encoding='GB2312')
        
if __name__ == '__main__':  
    txtcombine()

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 python讀取txt批量創建文件 Python Pandas 通過讀取txt文件內容創建DataFrame python讀取txt文件 python 讀取txt文件 python 讀取並復制txt文件【Python】txt文件讀取繪畫 python 讀取寫入txt文件 python從txt文件讀取數據 python 逐行讀取txt文件 007.PGSQL-python讀取txt文件，將數據轉化為dataFrame,dataFrame數據插入到pgsql; dataframe去掉索引，指定列為索引；python讀取pgsql數據,讀取數據庫表導成excel