filecmp模塊用於比較文件及文件夾的內容,它是一個輕量級的工具,使用非常簡單。python標准庫還提供了difflib模塊用於比較文件的內容。關於difflib模塊,且聽下回分解。
filecmp定義了兩個函數,用於方便地比較文件與文件夾:
filecmp.cmp(f1, f2[, shallow]):
比較兩個文件的內容是否匹配。參數f1, f2指定要比較的文件的路徑。可選參數shallow指定比較文件時是否需要考慮文件本身的屬性(通過os.stat函數可以獲得文件屬性)。如果文件內容匹配,函數返回True,否則返回False。
filecmp.cmpfiles(dir1, dir2, common[, shallow]):
比較兩個文件夾內指定文件是否相等。參數dir1, dir2指定要比較的文件夾,參數common指定要比較的文件名列表。函數返回包含3個list元素的元組,分別表示匹配、不匹配以及錯誤的文件列表。錯誤的文件指的是不存在的文件,或文件被瑣定不可讀,或沒權限讀文件,或者由於其他原因訪問不了該文件。
filecmp模塊中定義了一個dircmp類,用於比較文件夾,通過該類比較兩個文件夾,可以獲取一些詳細的比較結果(如只在A文件夾存在的文件列表),並支持子文件夾的遞歸比較。
dircmp提供了三個方法用於報告比較的結果:
- report():只比較指定文件夾中的內容(文件與文件夾)
- report_partial_closure():比較文件夾及第一級子文件夾的內容
- report_full_closure():遞歸比較所有的文件夾的內容
例子:在文件夾"1"中含有文件"1.txt", 在文件夾"2"中含有文件"1.txt"和"2.txt",其兩個文件夾下面的文件"1.txt"內容一樣,
1 >>>import filecmp 2 >>>x = filecmp.dircmp("1", "2") 3 >>>x.report() 4 >>>
diff 1 2
Only in 2 : ['2.txt']
Identical files : ['1.txt']
如果兩個文件夾下面的文件"1.txt"內容不相同那么結果如下:
1 >>>import filecmp 2 >>>x = filecmp.dircmp("1", "2") 3 >>>x.report() 4 >>>
diff 1 2
Only in 2 : ['2.txt']
Differing files : ['1.txt']
dircmp還提供了下面這些屬性用於獲取比較的詳細結果:
- left_list:左邊文件夾中的文件與文件夾列表;
- right_list:右邊文件夾中的文件與文件夾列表;
- common:兩邊文件夾中都存在的文件或文件夾;
- left_only:只在左邊文件夾中存在的文件或文件夾;
- right_only:只在右邊文件夾中存在的文件或文件夾;
- common_dirs:兩邊文件夾都存在的子文件夾;
- common_files:兩邊文件夾都存在的子文件;
- common_funny:兩邊文件夾都存在的子文件夾;
- same_files:匹配的文件;
- diff_files:不匹配的文件;
- funny_files:兩邊文件夾中都存在,但無法比較的文件;
- subdirs:我沒看明白這個屬性的意思,python手冊中的解釋如下:A dictionary mapping names in common_dirs to dircmp objects
簡單就是美!我只要文件比較的結果,不想去關心文件是如何是比較的,hey,就用python吧~~
原文:http://scm002.iteye.com/blog/1662812
以下是我做的demo:
1 #python filecmp 2 #比較文件/文件夾 3 4 from filecmp import * 5 6 def print_diff_files(dcmp): 7 print(dcmp.diff_files) 8 for name in dcmp.diff_files: 9 print("diff_file %s found in %s and %s" % (name, dcmp.left, dcmp.right)) 10 for sub_dcmp in dcmp.subdirs.values(): 11 print_diff_files(sub_dcmp) 12 13 def main(): 14 dirA = 'c:\\Download\\' 15 dirB = 'c:\\MyDrivers\\' 16 dcmp = dircmp(dirA, dirB) 17 print_diff_files(dcmp) 18 19 if __name__ == '__main__': 20 main()