什么是tr命令?tr,translate的簡寫,translate的翻譯:
[trænsˈleit]
vi. 翻譯, 能被譯出
vt. 翻譯, 解釋, 轉化, 轉變為, 調動
在這里用到的意思是轉化,轉變,轉換,在linux下輸入tr --help查看一下提示:
amosli@amosli-pc:~$ tr --help Usage: tr [OPTION]... SET1 [SET2] Translate, squeeze, and/or delete characters from standard input, writing to standard output. -c, -C, --complement use the complement of SET1 -d, --delete delete characters in SET1, do not translate -s, --squeeze-repeats replace each input sequence of a repeated character that is listed in SET1 with a single occurrence of that character -t, --truncate-set1 first truncate SET1 to length of SET2 --help display this help and exit --version output version information and exit SETs are specified as strings of characters. Most represent themselves. Interpreted sequences are: \NNN character with octal value NNN (1 to 3 octal digits) \\ backslash \a audible BEL \b backspace \f form feed \n new line \r return \t horizontal tab \v vertical tab CHAR1-CHAR2 all characters from CHAR1 to CHAR2 in ascending order [CHAR*] in SET2, copies of CHAR until length of SET1 [CHAR*REPEAT] REPEAT copies of CHAR, REPEAT octal if starting with 0 [:alnum:] all letters and digits [:alpha:] all letters [:blank:] all horizontal whitespace [:cntrl:] all control characters [:digit:] all digits [:graph:] all printable characters, not including space [:lower:] all lower case letters [:print:] all printable characters, including space [:punct:] all punctuation characters [:space:] all horizontal or vertical whitespace [:upper:] all upper case letters [:xdigit:] all hexadecimal digits [=CHAR=] all characters which are equivalent to CHAR Translation occurs if -d is not given and both SET1 and SET2 appear. -t may be used only when translating. SET2 is extended to length of SET1 by repeating its last character as necessary. Excess characters of SET2 are ignored. Only [:lower:] and [:upper:] are guaranteed to expand in ascending order; used in SET2 while translating, they may only be used in pairs to specify case conversion. -s uses SET1 if not translating nor deleting; else squeezing uses SET2 and occurs after translation or deletion.
全是英文?翻譯過來看下:
tr [選項]… 集合1 [集合2] 選項說明: -c, -C, –complement 用集合1中的字符串替換,要求字符集為ASCII。 -d, –delete 刪除集合1中的字符而不是轉換 -s, –squeeze-repeats 刪除所有重復出現字符序列,只保留第一個;即將重復出現字符串壓縮為一個字符串。 -t, –truncate-set1 先刪除第一字符集較第二字符集多出的字符 字符集合的范圍: \NNN 八進制值的字符 NNN (1 to 3 為八進制值的字符) \\ 反斜杠 \a Ctrl-G 鈴聲 \b Ctrl-H 退格符 \f Ctrl-L 走行換頁 \n Ctrl-J 新行 \r Ctrl-M 回車 \t Ctrl-I tab鍵 \v Ctrl-X 水平制表符 CHAR1-CHAR2 從CHAR1 到 CHAR2的所有字符按照ASCII字符的順序 [CHAR*] in SET2, copies of CHAR until length of SET1 [CHAR*REPEAT] REPEAT copies of CHAR, REPEAT octal if starting with 0 [:alnum:] 所有的字母和數字 [:alpha:] 所有字母 [:blank:] 水平制表符,空白等 [:cntrl:] 所有控制字符 [:digit:] 所有的數字 [:graph:] 所有可打印字符,不包括空格 [:lower:] 所有的小寫字符 [:print:] 所有可打印字符,包括空格 [:punct:] 所有的標點字符 [:space:] 所有的橫向或縱向的空白 [:upper:] 所有大寫字母
tr用來從標准輸入中通過替換或刪除操作進行字符轉換。tr主要用於刪除文件中控制字符或進行字符轉換。使用tr時要轉換兩個字符串:字符串1用於查詢,字符串2用於處理各種轉換。tr剛執行時,字符串1中的字符被映射到字符串2中的字符,然后轉換操作開始。
通過使用 tr,您可以非常容易地實現 sed 的許多最基本功能。您可以將 tr 看作為 sed 的(極其)簡化的變體:它可以用一個字符來替換另一個字符,或者可以完全除去一些字符。您也可以用它來除去重復字符。這就是所有 tr 所能夠做的。
1、帶有最常用選項的tr命令格式為
tr -c -d -s ["string1_to_translate_from"] ["string2_to_translate_to"] < input-file
這里:
- -c 用字符串1中字符集的補集替換此字符集,要求字符集為ASCII。
- -d 刪除字符串1中所有輸入字符。
- -s 刪除所有重復出現字符序列,只保留第一個;即將重復出現字符串壓縮為一個字符串。
- input-file是轉換文件名。雖然可以使用其他格式輸入,但這種格式最常用。
2、字符范圍
指定字符串1或字符串2的內容時,只能使用單字符或字符串范圍或列表。
[a-z] a-z內的字符組成的字符串。
[A-Z] A-Z內的字符組成的字符串。
[0-9] 數字串。
\octal 一個三位的八進制數,對應有效的ASCII字符。
[O*n] 表示字符O重復出現指定次數n。因此[O*2]匹配OO的字符串。
tr中特定控制字符的不同表達方式
速記符含義八進制方式 \a Ctrl-G 鈴聲\007 \b Ctrl-H 退格符\010 \f Ctrl-L 走行換頁\014 \n Ctrl-J 新行\012 \r Ctrl-M 回車\015 \t Ctrl-I tab鍵\011 \v Ctrl-X \030
實例:
1、將文件file中出現的"abc"替換為"xyz"
[root@Gin scripts]# cat t.txt abc [root@Gin scripts]# cat t.txt |tr "abc" "xyz" xyz [root@Gin scripts]# cat t.txt abc
2、使用tr命令“統一”字母大小寫
[root@Gin scripts]# cat file abc [root@Gin scripts]# cat file|tr [a-z] [A-Z] ABC
大寫轉小寫只需要把tr后面的參數換個位置即可!
3、把文件中的數字0-9替換為a-j
[root@Gin scripts]# cat file|tr [0-9] [a-j] abcdefghij
4、刪除文件file中出現的"Snail"字符
[root@Gin scripts]# cat file what is Snail [root@Gin scripts]# cat file|tr -d "Snail" wht s [root@Gin scripts]# cat file what is Snail
5、刪除文件file中出現的換行'\n'、制表'\t'字符
# cat file | tr -d "\n\t"
7、刪除空行
# cat file | tr -s "\n" > new_file
8、刪除Windows文件“造成”的'^M'字符
# cat file | tr -d "\r" 或者 # cat file | tr -s "\r" "\n"
9、用空格符\040替換制表符\011
# cat file | tr -s "\011" "\040"
10、把路徑變量中的冒號":",替換成換行符"\n"
# echo $PATH | tr -s ":" "\n"
實際應用1,加密解密:
[root@Gin scripts]# echo 12345|tr '0-9' '987654321' ## 加密 87654 [root@Gin scripts]# echo 87654|tr '987654321' '0-9' ## 解密 12345
上面是一個非常有趣的小例子,通過映射來實現簡單的加密解密,看懂這個例子,可以接着往下看古羅馬時期發明的凱撒加密的一種變體ROT13
[root@Gin scripts]# echo "hi,this is amosli" | tr 'ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz' 'NOPQRSTUVWXYZABCDEFGHIJKLMnopqrstuvwxyzabcdefghijklm' uv,guvf vf nzbfyv [root@Gin scripts]# echo "uv,guvf vf nzbfyv" | tr 'ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz' 'NOPQRSTUVWXYZABCDEFGHIJKLMnopqrstuvwxyzabcdefghijklm' hi,this is amosli
ROT13是它自己本身的逆反;也就是說,要還原ROT13,套用加密同樣的算法即可得,故同樣的操作可用再加密與解密。非常神奇!
實際應用2,字符集補集:
tr -c [set1] [set2]
set1的補集意味着從這個集合中包含set1中沒有的所有字符。最典型的用法就是從輸入文本中將不在補集中的所有字符全部刪除。例如:
[root@Gin scripts]# echo "hello 123 world " | tr -d -c '0-9 \n' 123
在這里,補集中包含了除數字、空格字符和換行符之外的所有字符,因為指定了-d,所以這些字符全部都會被刪除。
實際應用3,用tr壓縮字符:
[root@Gin scripts]# echo "GNU is not UNIX . Recursicve right?" | tr -s ' ' GNU is not UNIX . Recursicve right?
使用-s參數可以壓縮字符串中重復的字符。看另一個例子:
[root@Gin scripts]# cat sum.txt 5 4 3 5 4 3 [root@Gin scripts]# cat sum.txt|echo $[ $(tr '\n' '+') 0 ] 24 [root@Gin scripts]# cat sum.txt|echo $[ $(tr '\n' '+') ] -bash: 5+4+3+5+4+3+ : syntax error: operand expected (error token is "+ ")
這里,運用tr實現了加法運算, tr '\n' '+'使用換行符來替換為'+'然后連接起來,最后多出來一個'+'再接上數字0即實現了加法。