python中os.walk是一個簡單易用的文件、目錄遍歷器,可以幫助我們高效的處理文件、目錄方面的事情。
1.載入
要使用os.walk,首先要載入該函數
可以使用以下兩種方法
- import os
- from os import walk
2.使用
os.walk的函數聲明為:
walk(top, topdown=True, οnerrοr=None, followlinks=False)
參數
- top 是你所要便利的目錄的地址
- topdown 為真,則優先遍歷top目錄,否則優先遍歷top的子目錄(默認為開啟)
- onerror 需要一個 callable 對象,當walk需要異常時,會調用
- followlinks 如果為真,則會遍歷目錄下的快捷方式(linux 下是 symbolic link)實際所指的目錄(默認關閉)
os.walk 的返回值是一個生成器(generator),也就是說我們需要不斷的遍歷它,來獲得所有的內容。
每次遍歷的對象都是返回的是一個三元組(root,dirs,files)
- root 所指的是當前正在遍歷的這個文件夾的本身的地址
- dirs 是一個 list ,內容是該文件夾中所有的目錄的名字(不包括子目錄)
- files 同樣是 list , 內容是該文件夾中所有的文件(不包括子目錄)
如果topdown 參數為真,walk 會遍歷top文件夾,與top文件夾中每一個子目錄。
3、舉個例子
如果我們有如下的文件結構
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
|
for
(root, dirs, files)
in
os.walk(
'a'
):
#第一次運行時,當前遍歷目錄為 a
所以 root ==
'a'
dirs == [
'b'
,
'c'
,
'd'
]
files == [
'4.txt'
,
'5.txt'
]
。。。
# 接着遍歷 dirs 中的每一個目錄
b: root =
'a\\b'
dirs = []
files = [
'1.txt'
,
'2.txt'
]
# dirs為空,返回
# 遍歷c
c: root =
'a\\c'
dirs = []
files = [
'3.txt'
]
PS : 如果想獲取文件的全路徑,只需要
for
f
in
files:
path = os.path.
join
(root,f)
# 遍歷d
d: root =
'a\\b'
dirs = []
files = []
遍歷完畢,退出循環
|
4、實際使用 保持目錄 a 的目錄結構,在 b 中創建對應的文件夾,並把a中所有的文件加上后綴 _bak
import os Root = 'a' Dest = 'b' for (root, dirs, files) in os.walk(Root): new_root = root.replace(Root, Dest, 1) if not os.path.exists(new_root): os.mkdir(new_root) for d in dirs: d = os.path.join(new_root, d) if not os.path.exists(d): os.mkdir(d) for f in files: # 把文件名分解為 文件名.擴展名 # 在這里可以添加一個 filter,過濾掉不想復制的文件類型,或者文件名 (shotname, extension) = os.path.splitext(f) # 原文件的路徑 old_path = os.path.join(root, f) new_name = shotname + '_bak' + extension # 新文件的路徑 new_path = os.path.join(new_root, new_name) try: # 復制文件 open(new_path, 'wb').write(open(old_path, 'rb').read()) except IOError as e:
喜歡這篇文章?歡迎打賞~~