# -*- coding:utf-8 -*- #將所有TXT連接成一個,並刪除掉重復記錄 import os import time def BianLi(rootDir): print "開始拼接數據,請稍等..." start_time = time.time() fh = open('C://Users//Administrator//PycharmProjects//···//ALL.txt', "w") list1=[] for root,dirs,files in os.walk(rootDir): for filename in files: #這里得到的filename只是一個文件名的字符串而已,如:test.txt filepath = rootDir+filename #拼接目錄和文件名得到完整路徑 file = open(filepath, 'r') for i in file: #i即為file中的一行,不用再readline()了 line = str(i).strip() print str(line) if line in list1: #判斷list里面是否有這個記錄了,如果沒有就加入list,如果有就跳過 continue else: list1.append(line) #向list里添加記錄 fh.write(line+'\n') fh.close() end_time = time.time() print "全部數據拼接完畢,用時%.2f秒" % (end_time - start_time) rootDir = 'C://Users//Administrator//PycharmProjects//···//test//' BianLi(rootDir) #調用方法