參考:http://www.cnblogs.com/-ios/p/4949923.html
必讀
涵蓋范圍:
- 這篇文章對剛接觸命令行的新手以及具有命令行使用經驗的人都有用處。本文致力於做到覆蓋面廣(盡量包括一切重要的內容),具體(給出最常見的具體的例子)以及簡潔(避免一些不必要的東西以及一些偏題的可以在其他地方翻閱到文獻的東西)。 每個小技巧在某個特定情境下都是基本的或能夠顯著地節約時間。
- 本文為 Linux 所寫,除了僅限 MacOS X 系統節。其它節中的大部分內容都適用於其它 Unix 系統或 MacOS 系統,甚至 Cygwin。
- 本文關注於交互式 Bash,盡管很多技巧也適用於其他 shell 或 Bash 腳本。
- 本文包括了“標准的”Unix 命令和需要安裝特定包的命令,只要它們足夠重要。
注意事項:
- 為了能在一頁內展示盡量多的東西,一些具體的信息會被間接的包含在引用頁里。聰明機智的你如果掌握了使用 Google 搜索引擎的基本思路與命令,那么你將可以查閱到更多的詳細信息。使用
apt-get
/yum
/dnf
/pacman
/pip
/brew
(以及其它合適的包管理器)來安裝新程序。 - 使用 Explainshell 去獲取相關命令、參數、管道等內容的解釋。
基礎
-
學習 Bash 的基礎知識。具體來說,輸入
man bash
並至少全文瀏覽一遍; 它很簡單並且不長。其他的 shell 可能很好用,但 Bash 功能強大且幾乎所有情況下都是可用的 ( 只學習 zsh,fish 或其他的 shell 的話,在你自己的電腦上會顯得很方便,但在很多情況下會限制你,比如當你需要在服務器上工作時)。 -
學習並掌握至少一個基於文本的編輯器。通常 Vim (
vi
) 會是你最好的選擇,因為在終端里進行隨機編輯 Vim 真的毫無敵手,哪怕是 Emacs、某大型 IDE 甚至時下非常流行的編輯器。 -
學會如何使用
man
命令去閱讀文檔。學會使用apropos
去查找文檔。了解有些命令並不對應可執行文件,而是Bash內置的,可以使用help
和help -d
命令獲取幫助信息。 -
學會使用
>
和<
來重定向輸出和輸入,學會使用|
來重定向管道。明白>
會覆蓋了輸出文件而>>
是在文件未添加。了解標准輸出 stdout 和標准錯誤 stderr。 -
學會使用通配符
*
(或許再算上?
和[
...]
) 和引用以及引用中'
和"
的區別。 -
熟悉 Bash 任務管理工具:
&
,ctrl-z,ctrl-c,jobs
,fg
,bg
,kill
等。 -
了解
ssh
,以及學會通過使用ssh-agent
,ssh-add
等命令來實現基本的無密碼認證。 -
學會基本的文件管理:
ls
和ls -l
(了解ls -l
中每一列代表的意義),less
,head
,tail
和tail -f
(甚至less +F
),ln
和ln -s
(了解硬鏈接與軟鏈接的區別),chown
,chmod
,du
(硬盤使用情況概述:du -hk *
)。 關於文件系統的管理,學習df
,mount
,fdisk
,mkfs
,lsblk
。知道 inode 是什么(與ls -i
和df -i
等命令相關)。 -
學習基本的網絡管理:
ip
或ifconfig
,dig
。 -
熟悉正則表達式,以及
grep
/egrep
里不同參數的作用,例如-i
,-o
,-v
,-A
,-B
和-C
,這些參數是值得學習並掌握的。 -
學會使用
apt-get
,yum
,dnf
或pacman
(取決於你使用的 Linux 發行版)來查找或安裝軟件包。並確保你的環境中有pip
來安裝基於 Python 的命令行工具 (接下來提到的部分程序使用pip
來安裝會很方便)。
日常使用
-
在 Bash 中,可以使用 Tab 自動補全參數,使用 ctrl-r 搜索命令行歷史。
-
在 Bash 中,可以使用 ctrl-w 刪除你鍵入的最后一個單詞,使用 ctrl-u 刪除整行,使用 alt-b 和 alt-f 以單詞為單位移動光標,使用 ctrl-a 將光標移至行首,使用 ctrl-e 將光標移至行尾,使用 ctrl-k 刪除光標至行尾的所有內容,使用 ctrl-l 清屏。鍵入
man readline
查看 Bash 中的默認快捷鍵,內容很多。例如 alt-. 循環地移向前一個參數,以及 alt-* 展開通配符。 -
你喜歡的話,可以鍵入
set -o vi
來使用 vi 風格的快捷鍵,而set -o emacs
可以把它改回來。 -
為了方便地鍵入長命令,在設置你的編輯器后(例如
export EDITOR=vim
),鍵入 ctrl-x ctrl-e 會打開一個編輯器來編輯當前命令。在 vi 模式下則鍵入 escape-v 實現相同的功能。 -
鍵入
history
查看命令行歷史記錄。其中有許多縮寫,例如!$
(最后鍵入的參數)和!!
(最后鍵入的命令),盡管通常被 ctrl-r 和 alt-. 取代。 -
回到上一個工作路徑:
cd -
-
如果你輸入命令的時候改變了主意,按下 alt-# 來在行首添加
#
,或者依次按下 ctrl-a, #, enter。這樣做的話,之后你可以很方便的利用命令行歷史回到你剛才輸入到一半的命令。 -
使用
xargs
( 或parallel
)。他們非常給力。注意到你可以控制每行參數個數(-L
)和最大並行數(-P
)。如果你不確定它們是否會按你想的那樣工作,先使用xargs echo
查看一下。此外,使用-I{}
會很方便。例如:
find . -name '*.py' | xargs grep some_function cat hosts | xargs -I{} ssh root@{} hostname
-
pstree -p
有助於展示進程樹。 -
使用
pgrep
和pkill
根據名字查找進程或發送信號(-f
參數通常有用)。 -
了解你可以發往進程的信號的種類。比如,使用
kill -STOP [pid]
停止一個進程。使用man 7 signal
查看詳細列表。 -
使用
nohup
或disown
使一個后台進程持續運行。 -
使用
netstat -lntp
或ss -plat
檢查哪些進程在監聽端口(默認是檢查 TCP 端口; 使用參數-u
檢查 UDP 端口)。 -
有關打開套接字和文件,請參閱
lsof
。 -
使用
uptime
或w
來查看系統已經運行多長時間。 -
使用
alias
來創建常用命令的快捷形式。例如:alias ll='ls -latr'
使你可以方便地執行ls -latr
命令。 -
在 Bash 腳本中,使用
set -x
去調試輸出,盡可能的使用嚴格模式,使用set -e
令腳本在發生錯誤時退出而不是繼續運行,使用set -u
來檢查是否使用了未賦值的變量,使用set -o pipefail
嚴謹地對待錯誤(盡管問題可能很微妙)。當牽扯到很多腳本時,使用trap
。一個好的習慣是在腳本文件開頭這樣寫,這會使它檢測一些錯誤,並在錯誤發生時中斷程序並輸出信息:
set -euo pipefail trap "echo 'error: Script failed: see failed command above'" ERR
- 在 Bash 腳本中,子 shell(使用括號
(...)
)是一種便捷的方式去組織參數。一個常見的例子是臨時地移動工作路徑,代碼如下:
# do something in current dir (cd /some/other/dir && other-command) # continue in original dir
-
在 Bash 中,注意到其中有許多形式的擴展。檢查變量是否存在:
${name:?error message}
。例如,當 Bash 腳本需要一個參數時,可以使用這樣的代碼input_file=${1:?usage: $0 input_file}
。數學表達式:i=$(( (i + 1) % 5 ))
。序列:{1..10}
。 截斷字符串:${var%suffix}
和${var#prefix}
。例如,假設var=foo.pdf
,那么echo ${var%.pdf}.txt
將輸出foo.txt
。 -
使用括號擴展(
{
...}
)可以減少不必要的重復輸入相似文本以及文本組合。 -
通過使用
<(some command)
可以將輸出視為文件。例如,對比本地文件/etc/hosts
和一個遠程文件:
diff /etc/hosts <(ssh somehost cat /etc/hosts)
-
了解 Bash 中的“here documents”,例如
cat <<EOF ...
。 -
在 Bash 中,同時重定向標准輸出和標准錯誤,
some-command >logfile 2>&1
。通常,為了保證命令不會在標准輸入里殘留一個打開了的文件句柄導致你當前所在的終端無法操作,添加</dev/null
是一個好習慣。 -
使用
man ascii
查看具有十六進制和十進制值的ASCII表。man unicode
,man utf-8
,以及man latin1
有助於你去了解通用的編碼信息。 -
使用
screen
或tmux
來使用多個屏幕,當你在使用 ssh 時(保存 session 信息)將尤為有用。另一個輕量級的解決方案是dtach
。 -
ssh 中,了解如何使用
-L
或-D
(偶爾需要用-R
)去開啟隧道是非常有用的,例如當你需要從一台遠程服務器上訪問 web。 -
對 ssh 設置做一些小優化可能是很有用的,例如這個
~/.ssh/config
文件包含了防止特定環境下斷開連接、壓縮數據、多通道等選項:
TCPKeepAlive=yes ServerAliveInterval=15 ServerAliveCountMax=6 Compression=yes ControlMaster auto ControlPath /tmp/%r@%h:%p ControlPersist yes
-
部分其他的關於 ssh 的選項是安全敏感且應當小心啟用的。例如在可信任的網絡中:
StrictHostKeyChecking=no
,ForwardAgent=yes
-
考慮使用
mosh
作為 ssh 的替代品,它使用 UDP 協議。 -
獲取文件的八進制格式權限,使用類似如下的代碼:
stat -c '%A %a %n' /etc/timezone
-
使用
fpp
(PathPicker)可以與基於另一個命令(例如git
)輸出的文件交互。 -
將 web 服務器上當前目錄下所有的文件(以及子目錄)暴露給你所處網絡的所有用戶,使用:
python -m SimpleHTTPServer 7777
(使用端口 7777 和 Python 2)或python -m http.server 7777
(使用端口 7777 和 Python 3)。 -
以某種權限執行命令,使用
sudo
(root 權限)或sudo -u
(其他用戶)。使用su
或者sudo bash
來啟動一個以對應用戶權限運行的 shell。使用su -
模擬其他用戶的登錄。
文件及數據處理
-
在當前路徑下通過文件名定位一個文件,
find . -iname '*something*'
(或類似的)。在所有路徑下通過文件名查找文件,使用locate something
(但請記住updatedb
可能沒有對最近新建的文件建立索引)。 -
使用
ag
在源代碼或數據文件里檢索(比grep -r
更好)。 -
將HTML轉為文本:
lynx -dump -stdin
-
Markdown,HTML,以及所有文檔格式之間的轉換,試試
pandoc
。 -
如果你不得不處理 XML,
xmlstarlet
寶刀未老。 -
使用
jq
處理 JSON。 -
Excel 或 CSV 文件的處理,csvkit 提供了
in2csv
,csvcut
,csvjoin
,csvgrep
等工具。 -
關於 Amazon S3,
s3cmd
很方便而s4cmd
更快。Amazon 官方的aws
以及saws
是其他 AWS 相關工作的基礎。 -
了解如何使用
sort
和uniq
,包括 uniq 的-u
參數和-d
參數,詳見后文一行代碼節。另外可以了解一下comm
。 -
了解如何使用
cut
,paste
和join
來更改文件。很多人都會使用cut
,但幾乎都不會使用join
。 -
了解如何運用
wc
去計算新行數(-l
),字符數(-m
),單詞數(-w
)以及字節數(-c
)。 -
了解如何使用
tee
將標准輸入復制到文件甚至標准輸出,例如ls -al | tee file.txt
。 -
了解語言環境對許多命令行工具的微妙影響,包括排序的順序和性能。大多數 Linux 的安裝過程會將
LANG
或其他有關的變量設置為符合本地的設置。意識到當你改變語言環境時,排序的結果可能會改變。明白國際化可能會時 sort 或其他命令運行效率下降許多倍。某些情況下(例如集合運算)你可以放心的使用export LC_ALL=C
來忽略掉國際化並使用基於字節的順序。 -
了解
awk
和sed
關於數據的簡單處理的用法。例如,將文本文件中第三列的所有數字求和:awk '{ x += $3 } END { print x }'
. 這可能比同等作用的 Python 代碼快三倍且代碼量少三倍。 -
替換一個或多個文件中出現的字符串:
perl -pi.bak -e 's/old-string/new-string/g' my-files-*.txt
- 依據某種模式批量重命名多個文件,使用
rename
。對於復雜的重命名規則,repren
或許有幫助。
# Recover backup files foo.bak -> foo: rename 's/\.bak$//' *.bak # Full rename of filenames,directories,and contents foo -> bar: repren --full --preserve-case --from foo --to bar .
-
使用
shuf
從一個文件中隨機選取多行。 -
了解
sort
的參數。處理數字方面,使用-n
或者-h
來處理可讀性數字(例如du -h
的輸出)。明白鍵的工作原理(-t
和-k
)。例如,注意到你需要-k1,1
來僅按第一個域來排序,而-k1
意味着按整行排序。穩定排序(sort -s
)在某些情況下很有用。例如,以第二個域為主關鍵字,第一個域為次關鍵字進行排序,你可以使用sort -k1,1 | sort -s -k2,2
。 -
如果你想在 Bash 命令行中寫 tab 制表符,按下 ctrl-v [Tab] 或鍵入
$'\t'
(后者可能更好,因為你可以復制粘貼它)。 -
標准的源代碼對比及合並工具是
diff
和patch
。使用diffstat
查看變更總覽數據。注意到diff -r
對整個文件夾有效。使用diff -r tree1 tree2 | diffstat
查看變更總覽數據。 -
對於二進制文件,使用
hd
使其以十六進制顯示以及使用bvi
來編輯二進制。 -
同樣對於二進制文件,使用
strings
(包括grep
等等)允許你查找一些文本。 -
二進制文件對比(Delta 壓縮),使用
xdelta3
。 -
使用
iconv
更改文本編碼。而更高級的用法,可以使用uconv
,它支持一些高級的 Unicode 功能。例如,這條命令將所有元音字母轉為小寫並移除了:
uconv -f utf-8 -t utf-8 -x '::Any-Lower; ::Any-NFD; [:Nonspacing Mark:] >; ::Any-NFC; ' < input.txt > output.txt
-
拆分文件,查看
split
(按大小拆分)和csplit
(按模式拆分)。 -
使用
zless
,zmore
,zcat
和zgrep
對壓縮過的文件進行操作。
系統調試
-
curl
和curl -I
可以便捷地被應用於 web 調試中,它們的好兄弟wget
也可以,或者是更潮的httpie
。 -
使用
iostat
、netstat
、top
(htop
更佳)和dstat
去獲取硬盤、cpu 和網絡的狀態。熟練掌握這些工具可以使你快速的對系統的當前狀態有一個大概的認識。 -
使用
netstat
和ss
查看網絡連接的細節。 -
若要對系統有一個深度的總體認識,使用
glances
。它在一個終端窗口中向你提供一些系統級的數據。這對於快速的檢查各個子系統非常有幫助。 -
若要了解內存狀態,運行並理解
free
和vmstat
的輸出。尤其注意“cached”的值,它指的是 Linux 內核用來作為文件緩存的內存大小,因此它與空閑內存無關。 -
Java 系統調試則是一件截然不同的事,一個可以用於 Oracle 的 JVM 或其他 JVM 上的調試的小技巧是你可以運行
kill -3 <pid>
同時一個完整的棧軌跡和堆概述(包括 GC 的細節)會被保存到標准輸出/日志文件。JDK 中的jps
,jstat
,jstack
,jmap
很有用。SJK tools 更高級. -
使用
mtr
去跟蹤路由,用於確定網絡問題。 -
用
ncdu
來查看磁盤使用情況,它比常用的命令,如du -sh *
,更節省時間。 -
查找正在使用帶寬的套接字連接或進程,使用
iftop
或nethogs
。 -
ab
工具(捆綁於 Apache)可以簡單粗暴地檢查 web 服務器的性能。對於更復雜的負載測試,使用siege
。 -
wireshark
,tshark
和ngrep
可用於復雜的網絡調試。 -
了解
strace
和ltrace
。這倆工具在你的程序運行失敗、掛起甚至崩潰,而你卻不知道為什么或你想對性能有個總體的認識的時候是非常有用的。注意 profile 參數(-c
)和附加到一個運行的進程參數 (-p
)。 -
了解使用
ldd
來檢查共享庫。 -
了解如何運用
gdb
連接到一個運行着的進程並獲取它的堆棧軌跡。 -
學會使用
/proc
。它在調試正在出現的問題的時候有時會效果驚人。比如:/proc/cpuinfo
,/proc/meminfo
,/proc/cmdline
,/proc/xxx/cwd
,/proc/xxx/exe
,/proc/xxx/fd/
,/proc/xxx/smaps
(這里的xxx
表示進程的 id 或 pid)。 -
當調試一些之前出現的問題的時候,
sar
非常有用。它展示了 cpu、內存以及網絡等的歷史數據。 -
查看你當前使用的系統,使用
uname
,uname -a
(Unix/kernel 信息) 或者lsb_release -a
(Linux 發行版信息)。 -
無論什么東西工作得很歡樂時試試
dmesg
(可能是硬件或驅動問題)。
一行代碼
一些命令組合的例子:
- 當你需要對文本文件做集合交、並、差運算時,結合使用
sort
/uniq
很有幫助。假設a
與b
是兩內容不同的文件。這種方式效率很高,並且在小文件和上G的文件上都能運用 (sort
不被內存大小約束,盡管在/tmp
在一個小的根分區上時你可能需要-T
參數),參閱前文中關於LC_ALL
和sort
的-u
參數的部分。
cat a b | sort | uniq > c # c is a union b cat a b | sort | uniq -d > c # c is a intersect b cat a b b | sort | uniq -u > c # c is set difference a - b
-
使用
grep . *
來閱讀檢查目錄下所有文件的內容,例如檢查一個充滿配置文件的目錄比如/sys
、/proc
、/etc
。 -
計算文本文件第三列中所有數的和(可能比同等作用的 Python 代碼快三倍且代碼量少三倍):
awk '{ x += $3 } END { print x }' myfile
- 如果你想在文件樹上查看大小\日期,這可能看起來像遞歸版的
ls -l
但比ls -lR
更易於理解:
find . -type f -ls
- 假設你有一個類似於 web 服務器日志文件的文本文件,並且一個確定的值只會出現在某些行上,假設一個
acct_id
參數在URI中。如果你想計算出每個acct_id
值有多少次請求,使用如下代碼:
cat access.log | egrep -o 'acct_id=[0-9]+' | cut -d= -f2 | sort | uniq -c | sort -rn
- 運行這個函數從這篇文檔中隨機獲取一條小技巧(解析 Markdown 文件並抽取項目):
function taocl() { curl -s https://raw.githubusercontent.com/jlevy/the-art-of-command-line/master/README.md | pandoc -f markdown -t html | xmlstarlet fo --html --dropdtd | xmlstarlet sel -t -v "(html/body/ul/li[count(p)>0])[$RANDOM mod last()+1]" | xmlstarlet unesc | fmt -80 }
冷門但有用
-
expr
:計算表達式或正則匹配 -
m4
:簡單地宏處理器 -
yes
:多次打印字符串 -
cal
:漂亮的日歷 -
env
:執行一個命令(腳本文件中很有用) -
printenv
:打印環境變量(調試時或在使用腳本文件時很有用) -
look
:查找以特定字符串開頭的單詞 -
cut
、paste
和join
:數據修改 -
fmt
:格式化文本段落 -
pr
:將文本格式化成頁/列形式 -
fold
:包裹文本中的幾行 -
column
:將文本格式化成多列或表格 -
expand
和unexpand
:制表符與空格之間轉換 -
nl
:添加行號 -
seq
:打印數字 -
bc
:計算器 -
factor
:分解因數 -
gpg
:加密並簽名文件 -
toe
:terminfo entries 列表 -
nc
:網絡調試及數據傳輸 -
socat
:套接字代理,與netcat
類似 -
slurm
:網絡可視化 -
dd
:文件或設備間傳輸數據 -
file
:確定文件類型 -
tree
:以樹的形式顯示路徑和文件,類似於遞歸的ls
-
stat
:文件信息 -
time
:執行命令,並計算執行時間 -
lockfile
:使文件只能通過rm -f
移除 -
logrotate
: 切換、壓縮以及發送日志文件 -
watch
:重復運行同一個命令,展示結果並高亮有更改的部分 -
tac
:反向輸出文件 -
shuf
:文件中隨機選取幾行 -
comm
:一行一行的比較排序過的文件 -
pv
:監視通過管道的數據 -
hd
,hexdump
,xxd
,biew
和bvi
:保存或編輯二進制文件 -
strings
:從二進制文件中抽取文本 -
tr
:轉換字母 -
iconv
或uconv
:簡易的文件編碼 -
split
和csplit
:分割文件 -
sponge
:在寫入前讀取所有輸入,在讀取文件后再向同一文件寫入時比較有用,例如grep -v something some-file | sponge some-file
-
units
:將一種計量單位轉換為另一種等效的計量單位(參閱/usr/share/units/definitions.units
) -
apg
:隨機生成密碼 -
7z
:高比例的文件壓縮 -
ldd
:動態庫信息 -
nm
:提取 obj 文件中的符號 -
ab
:性能分析 web 服務器 -
strace
:系統調用調試 -
mtr
:更好的網絡調試跟蹤工具 -
cssh
:可視化的並發 shell -
rsync
:通過 ssh 或本地文件系統同步文件和文件夾 -
wireshark
和tshark
:抓包和網絡調試工具 -
ngrep
:網絡層的 grep -
host
和dig
:DNS 查找 -
lsof
:列出當前系統打開文件的工具以及查看端口信息 -
dstat
:系統狀態查看 -
glances
:高層次的多子系統總覽 -
iostat
:硬盤使用狀態 -
mpstat
: CPU 使用狀態 -
vmstat
: 內存使用狀態 -
htop
:top 的加強版 -
last
:登入記錄 -
w
:查看處於登錄狀態的用戶 -
id
:用戶/組 ID 信息 -
sar
:系統歷史數據 -
iftop
或nethogs
:套接字及進程的網絡利用 -
ss
:套接字數據 -
dmesg
:引導及系統錯誤信息 -
sysctl
: 在內核運行時動態地查看和修改內核的運行參數 -
hdparm
:SATA/ATA 磁盤更改及性能分析 -
lsb_release
:Linux 發行版信息 -
lsblk
:列出塊設備信息:以樹形展示你的磁盤以及磁盤分區信息 -
lshw
,lscpu
,lspci
,lsusb
和dmidecode
:查看硬件信息,包括 CPU、BIOS、RAID、顯卡、USB設備等 -
lsmod
和modinfo
:列出內核模塊,並顯示其細節 -
fortune
,ddate
和sl
:額,這主要取決於你是否認為蒸汽火車和莫名其妙的名人名言是否“有用”
僅限 MacOS X 系統
以下是僅限於 MacOS 系統的技巧
-
用
brew
(Homebrew)或者port
(MacPorts)進行包管理。這些可以用來在 Mac 系統上安裝以上的大多數命令。 -
用
pbcopy
復制任何命令的輸出到桌面應用,用pbpaste
粘貼輸入。 -
在終端中將 Option 鍵視為 alt 鍵,Preferences -> Profiles -> Keyboard 勾選上 "Use Option as Meta key"。
-
用
open
或者open -a /Applications/Whatever.app
使用桌面應用打開文件。 -
Spotlight: 用
mdfind
搜索文件,用mdls
列出元數據(例如照片的 EXIF 信息)。 -
注意 MacOS 系統是基於 BSD UNIX 的,許多命令(例如
ps
,ls
,tail
,awk
,sed
)都和 Linux 中有些微的不同,這些極大的被 System V-style Unix 和 GNU 工具影響。你可以通過標題為 "BSD General Commands Manual" 的 man 頁面發現這些不同。在有些情況下 GNU 版本的命令也可能被安裝(例如gawk
和gsed
對應 GNU 中的 awk 和 sed )。如果要寫跨平台的 Bash 腳本,避免使用這些命令(例如,考慮 Python 或者perl
)或者經過仔細的測試。
更多資源
- awesome-shell:一份精心組織的命令行工具及資源的列表。
- Strict mode:為了編寫更好的腳本文件。.
- shellcheck:一個 shell 腳本分析工具,基本上等同於 bash/sh/zsh 的 lint。
- Filenames and Pathnames in Shell:在 shell 腳本里正確處理文件名的好工具。