轉自: http://www.jb51.net/article/54640.htm
用python進行文件遍歷有多種方法,這里列舉並說明一下。
os.path.walk()
這是一個傳統的用法。
walk(root,callable,args)方法有三個參數:要遍歷的目錄,回調函數,回調函數的參數(元組形式)。
調用的過程是遍歷目錄下的文件或目錄,每遍歷一個目錄,調用回調函數,並把args作為參數傳遞給回調函數。
回調函數定義時也有三個參數,比如示例中的func中的三個參數,分別為walk傳來的參數、目錄的路徑、目錄下的文件列表(只有文件名,不是完整路徑)。請看示例:
import os
s = os.sep #根據unix或win,s為\或/
root = "d:" + s + "ll" + s #要遍歷的目錄
def func(args,dire,fis): #回調函數的定義
for f in fis:
fname = os.path.splitext(f) #分割文件名為名字和擴展名的二元組
new = fname[0] + 'b' + fname[1] #改名字
os.rename(os.path.join(dire,f),os.path.join(dire,new)) #重命名
os.path.walk(root,func,()) #遍歷
這種方法在使用時有個問題,不能遞歸遍歷下一層(這點我還不確定,歡迎指正)。
python的高級版本中加入了os.walk(),比這個好用。
os.walk()
原型為:os.walk(top, topdown=True, onerror=None, followlinks=False)
我們一般只使用第一個參數。(topdown指明遍歷的順序)
該方法對於每個目錄返回一個三元組,(dirpath, dirnames, filenames)。第一個是路徑,第二個是路徑下面的目錄,第三個是路徑下面的非目錄(對於windows來說也就是文件)。請看示例:
import os
s = os.sep
root = "d:" + s + "ll" + s
for rt, dirs, files in os.walk(root):
for f in files:
fname = os.path.splitext(f)
new = fname[0] + 'b' + fname[1]
os.rename(os.path.join(rt,f),os.path.join(rt,new))
這種方式可以遞歸遍歷所有的文件。
listdir
可以使用os模塊下的幾個方法組合起來進行遍歷。請看示例:
import os
s = os.sep
root = "d:" + s + "ll" + s
for i in os.listdir(root):
if os.path.isfile(os.path.join(root,i)):
print i
這里需要注意的是,其中的i是目錄或文件名,不是完整的路徑,在使用時要結合os.path.join()方法還原完整路徑。
遍歷搞定之后,文件名的修改可以使用正則表達式做一些高級的處理。
另外,還可以使用os.system(cmd)來調用shell里面的相關命令對文件進行處理,很好很強大。
# coding:utf-8
import sys, os
s = os.sep
root = "f:" + s + "Install" + s + "OLD" + s
for rt, dirs, files in os.walk(root):
for f in files:
fname = os.path.splitext(f)
if fname[1] == ".js":
print(root + rt + s + f)
os.chdir(rt + s)
os.remove(f)
print(f)
elif fname[1] == ".css":
os.chdir(rt + s)
os.remove(rt + s + f)
print(f)