[Linux] diff 查找文件的異同


  diff 命令是 linux上非常重要的工具,用於比較文件的內容,特別是比較兩個版本不同的文件以找到改動的地方。diff在命令行中打印每一個行的改動。最新版本的diff還支持二進制文件。diff程序的輸出被稱為補丁 (patch),因為Linux系統中還有一個patch程序,可以根據diff的輸出將a.c的文件內容更新為b.c。diff是svn、cvs、git等版本控制工具不可或缺的一部分。

1.命令格式:
  diff[參數][變動前:文件1或目錄1] [變動后:文件2或目錄2]

2.命令功能:
  diff命令能比較單個文件或者目錄內容。

  如果指定比較的是文件,則只有當輸入為文本文件時才有效。以逐行的方式,比較文本文件的異同處。

  如果指定比較的是目錄的的時候,diff 命令會比較兩個目錄下名字相同的文本文件。列出不同的二進制文件、公共子目錄和只在一個目錄出現的文件。

3.命令參數:
- 指定要顯示多少行的文本。此參數必須與-c或-u參數一並使用。
-a或--text  diff預設只會逐行比較文本文件。
-b或--ignore-space-change  不檢查空格字符的不同
-B或--ignore-blank-lines  不檢查空白行
-c  顯示全部內文,並標出不同之處。
-C或--context  與執行"-c-"指令相同。
-d或--minimal  使用不同的演算法,以較小的單位來做比較。
-D或ifdef  此參數的輸出格式可用於前置處理器巨集。
-e或--ed  此參數的輸出格式可用於ed的script文件。
-f或-forward-ed  輸出的格式類似ed的script文件,但按照原來文件的順序來顯示不同處。
-H或--speed-large-files  比較大文件時,可加快速度。
-l或--ignore-matching-lines  若兩個文件在某幾行有所不同,而這幾行同時都包含了選項中指定的字符或字符串,則不顯示這兩個文件的差異。
-i或--ignore-case  不檢查大小寫的不同。
-l或--paginate  將結果交由pr程序來分頁。
-n或--rcs  將比較結果以RCS的格式來顯示。
-N或--new-file  在比較目錄時,若文件A僅出現在某個目錄中,預設會顯示:Only in目錄:文件A若使用-N參數,則diff會將文件A與一個空白的文件比較。
-p  若比較的文件為C語言的程序碼文件時,顯示差異所在的函數名稱。
-P或--unidirectional-new-file  與-N類似,但只有當第二個目錄包含了一個第一個目錄所沒有的文件時,才會將這個文件與空白的文件做比較。
-q或--brief  僅顯示有無差異,不顯示詳細的信息。
-r或--recursive  比較子目錄中的文件。
-s或--report-identical-files  若沒有發現任何差異,仍然顯示信息。
-S或--starting-file  在比較目錄時,從指定的文件開始比較。
-t或--expand-tabs  在輸出時,將tab字符展開。
-T或--initial-tab  在每行前面加上tab字符以便對齊。
-u,-U或--unified=  以合並的方式來顯示文件內容的不同。
-v或--version  顯示版本信息。
-w或--ignore-all-space  忽略全部的空格字符
-W或--width  在使用-y參數時,指定欄寬
-x或--exclude  不比較選項中所指定的文件或目錄。
-X或--exclude-from  您可以將文件或目錄類型存成文本文件,然后在=中指定此文本文件。
-y或--side-by-side  以並列的方式顯示文件的異同之處
--help  顯示幫助。
--left-column  在使用-y參數時,若兩個文件某一行內容相同,則僅在左側的欄位顯示該行內容。
--suppress-common-lines  在使用-y參數時,僅顯示不同之處。

4. 實例

4.1 diff的三種格式

  由於歷史原因,diff有三種格式:

  * 正常格式(normal diff)

  * 上下文格式(context diff)

  * 合並格式(unified diff)

我們依次來看。

4.2 示例文件

  為了便於講解,先新建兩個示例文件。

  第一個文件叫做f1,內容是每行一個a,一共7行。

  a
  a
  a
  a
  a
  a
  a

  第二個文件叫做f2,修改f1而成,第4行變成b,其他不變。

  a
  a
  a
  b
  a
  a
  a

4.3 正常格式的diff

  對f1和f2進行比較:

  $ diff f1 f2

  這時,diff就會顯示正常格式的結果:

  4c4
  < a
  ---
  > b

  第一行是一個提示,用來說明變動位置。

  4c4

  它分成三個部分:

    前面的"4",表示f1的第4行有變化;

    中間的"c"表示變動的模式是內容改變(change),其他模式還有"增加"(a,代表addition)和"刪除"(d,代表deletion);

    后面的"4",表示變動后變成f2的第4行。

  第二行分成兩個部分。

  < a

  前面的小於號,表示要從f1當中去除該行(也就是第4行),后面的"a"表示該行的內容。

  第三行用來分割f1和f2。

  ---

  第四行,類似於第二行。

  > b

  前面的大於號表示f2增加了該行,后面的"b"表示該行的內容。

4.4 上下文格式的diff

  上個世紀80年代初,加州大學伯克利分校推出BSD版本的Unix時,覺得diff的顯示結果太簡單,最好加入上下文,便於了解發生的變動。因此,推出了上下文格式的diff。

  它的使用方法是加入c參數(代表context)。

  $ diff -c f1 f2

  顯示結果如下:

  *** f1 2012-08-29 16:45:41.000000000 +0800
  --- f2 2012-08-29 16:45:51.000000000 +0800
  ***************
  *** 1,7 ****
   a
   a
   a
  !a
   a
   a
   a
  --- 1,7 ----
   a
   a
   a
  !b
   a
   a
   a

  這個結果分成四個部分。

  第一部分的兩行,顯示兩個文件的基本情況:文件名和時間信息。

  *** f1 2012-08-29 16:45:41.000000000 +0800
  --- f2 2012-08-29 16:45:51.000000000 +0800

  "***"表示變動前的文件,"---"表示變動后的文件。

  第二部分是15個星號,將文件的基本情況與變動內容分割開。

  ***************

  第三部分顯示變動前的文件,即f1。

  *** 1,7 ****
   a
   a
   a
  !a
   a
   a
   a

  這時不僅顯示發生變化的第4行,還顯示第4行的前面三行和后面三行,因此一共顯示7行。所以,前面的"*** 1,7 ****"就表示,從第1行開始連續7行。

  另外,文件內容的每一行最前面,還有一個標記位。如果為空,表示該行無變化;如果是感嘆號(!),表示該行有改動;如果是減號(-),表示該行被刪除;如果是加號(+),表示該行為新增。

  第四部分顯示變動后的文件,即f2。

  --- 1,7 ----
   a
   a
   a
  !b
   a
   a
   a

  除了變動行(第4行)以外,也是上下文各顯示三行,總共顯示7行。

4.5 合並格式的diff

  如果兩個文件相似度很高,那么上下文格式的diff,將顯示大量重復的內容,很浪費空間。1990年,GNU diff率先推出了"合並格式"的diff,將f1和f2的上下文合並在一起顯示。

  它的使用方法是加入u參數(代表unified)。

  $ diff -u f1 f2

  顯示結果如下:

  --- f1 2012-08-29 16:45:41.000000000 +0800
  +++ f2 2012-08-29 16:45:51.000000000 +0800
  @@ -1,7 +1,7 @@
   a
   a
   a
  -a
  +b
   a
   a
   a

  它的第一部分,也是文件的基本信息。

  --- f1 2012-08-29 16:45:41.000000000 +0800
  +++ f2 2012-08-29 16:45:51.000000000 +0800

  "---"表示變動前的文件,"+++"表示變動后的文件。

  第二部分,變動的位置用兩個@作為起首和結束。

  @@ -1,7 +1,7 @@

  前面的"-1,7"分成三個部分:減號表示第一個文件(即f1),"1"表示第1行,"7"表示連續7行。合在一起,就表示下面是第一個文件從第1行開始的連續7行。同樣的,"+1,7"表示變動后,成為第二個文件從第1行開始的連續7行。

  第三部分是變動的具體內容。

   a
   a
   a
  -a
  +b
   a
   a
   a

  除了有變動的那些行以外,也是上下文各顯示3行。它將兩個文件的上下文,合並顯示在一起,所以叫做"合並格式"。每一行最前面的標志位,空表示無變動,減號表示第一個文件刪除的行,加號表示第二個文件新增的行。

4.6 實例

實例1:比較兩個文件

root@localhost test3]# diff log2014.log log2013.log 
3c3
< 2014-03
---
> 2013-03
8c8
< 2013-07
---
> 2013-08
11,12d10
< 2013-11
< 2013-12

說明:上面的“3c3”和“8c8”表示log2014.log和log20143log文件在第3行和第8行內容有所不同;"11,12d10"表示第一個文件比第二個文件多了第11和12行。
diff 的normal 顯示格式有三種提示:

a - add
c - change
d - delete 

實例2:並排格式輸出
命令:diff log2013.log log2014.log  -y -W 50

[root@localhost test3]# diff log2014.log log2013.log -y -W 50
2013-01 2013-01
2013-02 2013-02
2014-03 | 2013-03
2013-04 2013-04
2013-05 2013-05
2013-06 2013-06
2013-07 2013-07
2013-07 | 2013-08
2013-09 2013-09
2013-10 2013-10
2013-11 <
2013-12 <
[root@localhost test3]# diff log2013.log log2014.log -y -W 50
2013-01 2013-01
2013-02 2013-02
2013-03 | 2014-03
2013-04 2013-04
2013-05 2013-05
2013-06 2013-06
2013-07 2013-07
2013-08 | 2013-07
2013-09 2013-09
2013-10 2013-10
> 2013-11
> 2013-12

說明:
“|”表示前后2個文件內容有不同
“<”表示后面文件比前面文件少了1行內容
“>”表示后面文件比前面文件多了1行內容

實例3:上下文輸出格式
命令:diff log2013.log log2014.log  -c

[root@localhost test3]# diff log2013.log log2014.log -c
*** log2013.log 2012-12-07 16:36:26.000000000 +0800
--- log2014.log 2012-12-07 18:01:54.000000000 +0800
***************
*** 1,10 ****
2013-01
2013-02
! 2013-03
2013-04
2013-05
2013-06
2013-07
! 2013-08
2013-09
2013-10
--- 1,12 ----
2013-01
2013-02
! 2014-03
2013-04
2013-05
2013-06
2013-07
! 2013-07
2013-09
2013-10
+ 2013-11
+ 2013-12[root@localhost test3]# diff log2014.log log2013.log -c
*** log2014.log 2012-12-07 18:01:54.000000000 +0800
--- log2013.log 2012-12-07 16:36:26.000000000 +0800
***************
*** 1,12 ****
2013-01
2013-02
! 2014-03
2013-04
2013-05
2013-06
2013-07
! 2013-07
2013-09
2013-10
- 2013-11
- 2013-12
--- 1,10 ----
2013-01
2013-02
! 2013-03
2013-04
2013-05
2013-06
2013-07
! 2013-08
2013-09
2013-10[root@localhost test3]#

說明:
這種方式在開頭兩行作了比較文件的說明,這里有三中特殊字符:
“+” 比較的文件的后者比前着多一行
“-” 比較的文件的后者比前着少一行
“!” 比較的文件兩者有差別的行

實例4:統一格式輸出
命令:diff log2014.log log2013.log  -u

[root@localhost test3]# diff log2014.log log2013.log -u
--- log2014.log 2012-12-07 18:01:54.000000000 +0800
+++ log2013.log 2012-12-07 16:36:26.000000000 +0800
@@ -1,12 +1,10 @@
2013-01
2013-02
-2014-03
+2013-03
2013-04
2013-05
2013-06
2013-07
-2013-07
+2013-08
2013-09
2013-10
-2013-11
-2013-12

說明:
它的第一部分,也是文件的基本信息:
--- log2014.log 2012-12-07 18:01:54.000000000 +0800
+++ log2013.log 2012-12-07 16:36:26.000000000 +0800
"---"表示變動前的文件,"+++"表示變動后的文件。
第二部分,變動的位置用兩個@作為起首和結束。
   @@ -1,12 +1,10 @@
前面的"-1,12"分成三個部分:減號表示第一個文件(即log2014.log),"1"表示第1行,"12"表示連續12行。合在一起,就表示下面是第一個文件從第1行開始的連續12行。同樣的,"+1,10"表示變動后,成為第二個文件從第1行開始的連續10行。

實例5:比較文件夾不同
命令:diff  test3 test6

[root@localhost test]# diff test3 test6
Only in test6: linklog.log
Only in test6: log2012.log
diff test3/log2013.log test6/log2013.log
1,10c1,3
< 2013-01
< 2013-02
< 2013-03
< 2013-04
< 2013-05
< 2013-06
< 2013-07
< 2013-08
< 2013-09
< 2013-10
---
> hostnamebaidu=baidu.com
> hostnamesina=sina.com
> hostnames=true
diff test3/log2014.log test6/log2014.log
1,12d0
< 2013-01
< 2013-02
< 2014-03
< 2013-04
< 2013-05
< 2013-06
< 2013-07
< 2013-07
< 2013-09
< 2013-10
< 2013-11
< 2013-12
Only in test6: log2015.log
Only in test6: log2016.log
Only in test6: log2017.log
[root@localhost test]# 

實例6:比較兩個文件不同,並生產補丁
命令:diff -ruN log2013.log log2014.log >patch.log

[root@localhost test3]# diff -ruN log2013.log log2014.log >patch.log
[root@localhost test3]# ll
總計 12
-rw-r--r-- 2 root root 80 12-07 16:36 log2013.log
-rw-r--r-- 1 root root 96 12-07 18:01 log2014.log
-rw-r--r-- 1 root root 248 12-07 21:33 patch.log
[root@localhost test3]# cat patc.log
cat: patc.log: 沒有那個文件或目錄
[root@localhost test3]# cat patch.log 
--- log2013.log 2012-12-07 16:36:26.000000000 +0800
+++ log2014.log 2012-12-07 18:01:54.000000000 +0800
@@ -1,10 +1,12 @@
2013-01
2013-02
-2013-03
+2014-03
2013-04
2013-05
2013-06
2013-07
-2013-08
+2013-07
2013-09
2013-10
+2013-11
+2013-12[root@localhost test3]#

實例7:打補丁
命令: cat log2013.log

[root@localhost test3]# cat log2013.log
2013-01
2013-02
2013-03
2013-04
2013-05
2013-06
2013-07
2013-08
2013-09
2013-10[root@localhost test3]# patch log2013.log patch.log 
patching file log2013.log
[root@localhost test3]# 
[root@localhost test3]# cat log2013.log 
2013-01
2013-02
2014-03
2013-04
2013-05
2013-06
2013-07
2013-07
2013-09
2013-10
2013-11
2013-12[root@localhost test3]#

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM