本文介紹一下 shell 的語法。
一、變量
在 shell 里,使用變量之前通常並不需要事先為他們做出聲明,需要使用的時候直接創建就行了。默認情況下,所有變量都被看做字符串並以字符串來存儲,即使它們被賦值為數值時也是如此。shell 和一些工具會在需要時把數值型字符串轉換成對應的數值以對它們進行操作。
1.1 變量的命名
shell 變量的命名規則如下:開頭是一個字母或下划線,后面可以接任意長度的字母、數字或下划線符號,變量名的字符長度並無限制(Bourne shell中)。不過為了兼容性(一些早期的shell里變量名是有長度限制的),一般還是不要超過255個字符。另外,Linux 區分大小寫。當用戶自己定義變量的時候,要注意變量名不能與 shell 中的關鍵字重名。
1.2 變量的賦值
shell 中變量的賦值方式如下:
變量名=值 # 注意 賦值語句兩邊不能有空格
注意,賦值語句兩邊不能有空格(即 “=” 號兩邊不能有空格)。等號右邊若有空格的話,需要加上引號(單引號或雙引號都是可以的)。shell 中可以在變量名前加上 $ 字符來取變量的值。用一個簡單的例子演示一下:
#!/bin/bash name=tongye age=23 address="Hubei Wuhan" money='10$' echo "$name $age in $address" echo "I have $money!" exit 0
輸出結果如下:
這里需要注意的是單引號和雙引號的用法:在單引號中,所有特殊字符都沒有特殊含義;在雙引號中,"$"、" ` "(反引號)、"\" 有特殊含義,其余的沒有特殊含義。至於反引號 " ` ",反引號中可以用來引用系統命令,其中的內容將會被優先執行,其功能與 $(...) 一樣,詳情后面再做敘述。
1.3 變量的類型
shell 中有四種類型的變量:用戶自定義變量、環境變量、位置參數變量和預定義變量。
1) 用戶自定義變量
用戶自定義變量只會在當前 shell 中生效,也就是“局部變量”,上面程序中的 name、age、address、money 等都是用戶自定義變量,只能在變量所在的那個 shell 腳本中生效。用戶自定義變量一般用小寫字母來命名。
2) 環境變量
當一個 shell 腳本程序開始執行時,一些變量會根據環境設置中的值進行初始化,這些變量通常用大寫字母做名字,以便與用戶自定義變量做區分,被稱為環境變量。環境變量可以在當前 shell 和這個 shell 的所有子 shell 中生效。如果把環境變量寫入相應的配置文件(如 /etc/profile ),那么這個環境變量就會在所有的 shell 中生效。系統自帶的環境變量的名字不可更改,但是值可以按需更改。用戶也可以使用 export 命令在 shell 中自己創建環境變量:
export 變量名=變量值 # 創建環境變量並賦值
一些主要的系統環境變量如下:
環境變量 | 描述 |
$HOME | 當前用戶的家目錄 |
$PATH | 以冒號分隔的用來搜索命令的目錄列表,決定了 shell 將到哪些目錄中去尋找命令或程序 |
$PS1 | 命令提示符,通常是 $ 字符,也可以自行設置 |
$PS2 | 二級提示符,用來提示后續的輸入,通常是 > 字符 |
$IFS | 輸入域分隔符。當 shell 讀取輸入時,它給出用來分隔單詞的一組字符,通常是空格、制表符和換行符 |
$0 | shell 腳本的名字 |
$# | 傳遞給腳本的參數個數 |
$$ | shell 腳本的進程號(PID),腳本程序通常會用它來生成一個唯一的臨時文件,如 /tmp/tmpfile_$$ |
3) 位置參數變量
位置參數變量主要用來向腳本中傳遞參數或數據,變量名不能自定義,變量作用也是固定的。主要有以下幾種位置參數變量:
位置參數變量 | 描述 |
$1、$2、... | 腳本程序的參數,分別代表程序的第1個參數、第2個參數、... 程序第10個以上的參數需要用大括號包含,如 ${10} |
$* | 代表命令行中的所有參數。在一個變量中將所有參數列出,各參數之間用環境變量 IFS 中的第一個字符分隔開。 |
$@ | 和 $* 一樣,也包含了命令行中的所有參數,但是不使用 IFS 環境變量,即使 IFS 為空,參數也是分開顯示的 |
關於 $0 和 $#,在有些資料上,也把這兩個歸為位置參數變量,本文是把它們歸為了環境變量。其中,$0 代表 shell 腳本本身(不算在參數行列),$# 代表傳遞給腳本的參數個數(不包括 $0)。
關於 $* 和 $@,這二者的區別就在 $* 使用 IFS 所定義的分隔符來分隔參數而 $@ 沒有使用。$* 將所有的參數視為一個整體,而 $@ 將所有的參數分別視為單獨的個體。一般來說,采用 $@ 來訪問腳本程序的參數會比較好,不必擔心 IFS 所設置的分隔符為空而導致各參數連在一起分不清楚。
4) 預定義變量
預定義變量是在 bash 中已經定義好了的變量,變量名不能自定義,變量作用也是固定的。實際上,位置參數變量就是預定義變量的一種。 除了上面介紹的一些外,這里再介紹兩個:
$? :保存最后一次執行的命令的返回狀態。如果 $? 的值為 0 ,則表明上一個命令成功執行;如果值非 0 ,則表明上一個命令沒有成功執行。
$! :用於保存后運行的最后一個進程的 PID 號。
二、算術運算
shell 的算術運算符與 C 語言里的差不多,優先級與順序也相同。但是,由於 shell 中所有變量都是被看做字符串來存儲的,因此,要處理算術表達式,還需要使用一些特殊手段將數值型字符串轉換成相應的數值。
2.1 使用 expr 命令對算術表達式求值
expr 命令將它的參數當做一個表達式來求值,可以用來進行數學運算。如下:
#!/bin/bash a=2 b=3 c=`expr $a + $b` echo $c
exit 0
這段代碼的輸出結果是:5 。注意使用 expr 命令的那一行,使用的是反引號 `` ,反引號中的內容會被優先執行,所以這一行代碼的作用是將 expr $a + $b 這一表達式的執行結果賦給變量 c 。也可以使用 $(...) 來替代反引號: c=$(expr $a + $b)。
關於反引號和 $( .. ) 表達式,需要說明的一點是,反引號是一種比較老的語法形式,如果你希望自己寫的腳本具備非常好的可移植性,那么可以使用反引號,新的腳本程序一般都使用 $(...) 來替代反引號了,以避免在反引號中處理一些特殊字符時需要應用的一些相對復雜的規則。比如,如果想在 ` ... ` 結構中使用 ` (反引號)字符,則需要使用轉義符 \ 來進行轉義,這樣會使代碼閱讀起來較為困難。反引號和 $( ... ) 都可以用來引用系統命令。
expr 命令的功能十分強大,可以支持許多表達式求值運算:
表達式 | 說明 |
expr1 | expr2 | 若 expr1 非零,則等於 expr1 ,否則等於 expr2。 |
expr1 & expr2 | 只要有一個表達式為零,則等於零,否則等於 expr1。 |
expr1 = expr2 | 等於(與 == 是同義的),若兩式相等則結果為1,不等結果為0 |
expr1 > expr2 | 大於 |
expr1 >= expr2 | 大於等於 |
expr1 < expr2 | 小於 |
expr1 <= expr2 | 小於等於 |
expr1 != expr2 | 不等於 |
expr1 + expr2 | 加 |
expr1 - expr2 | 減 |
expr1 * expr2 | 乘 |
expr1 / expr2 | 整除 |
expr1 % expr2 | 取余 |
注意:在 expr 命令所支持的操作符中,“ | 、 & 、< 、<= 、> 、 >= 、 * ” 這幾個需要用 \ 符進行轉義再使用。此外,表達式的各字符之間需要用空格隔開。 用一段代碼演示一下 expr 命令的使用方法:
#!/bin/bash a=5;b=6;c=0 echo $(expr $a \| $c) # 輸出 5 echo $(expr $b \& $c) # 輸出 0 echo $(expr $a \& $b) # 輸出 5 echo $(expr $a \<= $b) # 輸出 1 echo $(expr $a \* $b) # 輸出 30 echo $(expr $a = 2) # 輸出 1
exit 0
expr 命令中的 | 和 & 操作符比較特殊,並不是我們常見的按位或和按位與,而是邏輯操作:
expr1 \| expr2 是邏輯或運算,結果為真(1 表示真,0表示假)則返回 expr1 的值,否則返回 expr2 的值,具有短路功能(expr1 為非零,則表達式一定非零,直接返回 expr1 的值,而不必在對 expr2 的值做判斷);
expr1 \& expr2 是邏輯與運算,結果為真則返回 expr1 的值,否則返回 expr2 的值,具有短路功能(expr1 為零,則表達式一定為零,直接返回零,而不必再對 expr2 的值做判斷)。
2.2 使用 $(( ... )) 的方式對算術表達式求值
expr 雖然功能強大,但是上面已經提到,在進行一些運算的時候,需要使用 \ 符來進行轉義,這對於閱讀代碼的人來說並不友好。另一方面,expr 命令執行起來其實很慢,因為它需要調用一個新的 shell 來處理 expr 命令。更新更好的一種做法是使用 $((...)) 擴展的方式。只需要將准備求值的表達式放在 $((...)) 的括號中即可進行簡單的算術求值。且,所有支持 $(( ... )) 的shell,都可以讓用戶在提供變量名稱時,無須前置 $ 符。用一段代碼演示一下用法:
#!/bin/bash a=5;b=6 echo $(($a + $b)) # 輸出 11 。在變量名前加上 $,這在shell中一般是取變量值的意思 echo $((a + b)) # 輸出 11 。可見,變量前不加 $ 也是可以的,為了簡便,后面的代碼就不加 $ 了 echo $((a | b)) # 輸出 7 。這里的 | 是按位或操作符 echo $((a || b)) # 輸出 1 。這里的 || 是邏輯或操作符 echo $((a & b)) # 輸出 4 。這里的 & 是按位與操作符 echo $((a && b)) # 輸出 1 。這里的 && 是邏輯與操作符 echo $((a * b)) # 輸出 30 echo $((a == b)) # 輸出 0
exit 0
可以看到, $(( ... )) 與 expr 命令還是有些不同之處的:
1)首先一些操作符的功能不同( | 和 & );
2)其次, expr 表達式在使用一些操作符時是需要使用轉義操作的,而 $(( ... )) 結構不需要;
3)還有一點就是,$(( ... )) 結構中取變量的值可以不使用 $ 操作符。
一些更具體的使用方法,建議親自動手去操作一下,這里就不再作更詳細的敘述了。
三、使用 bash 計算器在shell腳本中進行浮點運算
可以發現,bash 中的基本算術運算只支持整數運算,要進行浮點運算的話,需要另尋方法,bash 計算器就是處理浮點運算的一個常見方案。
3.1 bash 計算器 bc
bash 計算器允許在命令行中輸入浮點表達式,然后解釋並計算該表達式,最后返回結果。可以使用 yum 安裝 bc 命令:
sudo yum install bc
在命令行輸入 bc 指令,即可進入 bash 計算器的界面:
如圖所示,是使用 bc 進行簡單的浮點運算。其中變量 scale 是 bc 命令的內建變量,用於控制計算結果保留到小數點后多少位,默認為0,故默認情況下,使用 5 / 4 得到的結果是1。在后續的程序中,將 scale 的值設置為了 4,即保計算結果留到小數點后 4 位,可以看到 5 / 4 的值為1.2500,保留到了小數點后 4 位。
實際上,bash 計算器是一種編程語言,除了識別數字外,還可以識別變量、表達式等許多東西,如下:
1)數字(包括整數和浮點數)
2)變量(簡單變量和數組)
3)注釋(# 或 /* */ 都能識別)
4)表達式
5)編程語句(if-then 等)
6)函數
舉個例子:
$ bc -q # 進入 bc 命令行 val1=5 # 新建變量 val1 並賦值 val2=1.1 # 新建變量 val2 並賦值 val3=val1 * val2 # 新建變量 val3 並賦值,val3 的值為 val1 和 val2 的乘積 print val3 # 打印變量 val3 的值
最終輸出結果為5.5
3.2 在腳本中使用 bc
既然已經知道了 bc 命令的用法,那么在腳本中使用 bc 也就很簡單了,只需要使用反引號`` 或者 $() 將 bc 命令包含起來就行了,即:
value=$(echo "options;expression" | bc)
其中,options用於進行一些變量的設置(如 scale 變量的設置,或其他的一些自定義變量),如果需要設置多個變量,只需要在變量之間用分號進行隔開;expression 參數定義了通過 bc 執行的數學表達式。舉個例子說明 bc 命令在 shell 腳本中的用法:
#!/bin/bash val1=$(echo "scale=4;5/4" | bc) echo the value of val1 is $val1
這個程序的輸出結果為:the value of val1 is 1.2500
四、shell 中的條件判斷命令 test 和 [
test 命令可以處理 shell 腳本中的各類工作。它產生的不是一般的輸出,而是可使用的退出狀態。test 命令通過接受各種不同的參數,來控制要執行哪種測試。在許多系統上,test 命令與 [ 命令的作用其實是一樣的,使用 [ 命令的時候,一般在結尾加上 ] 符號,使代碼更具可讀性。另外,需要注意一點的是,在使用 [ 命令時,[ 符號與被檢查的語句之間應該留有空格。shell 中通常使用 test 命令來產生控制結構所需要的條件,根據 test 命令的退出碼決定是否需要執行后面的代碼。
test 命令可以使用的條件類型有三類:字符串比較、算術比較和與文件有關的條件測試。
1)字符串比較
表達式 | 結果 |
string1 = string2 | 如果兩個字符串相同則結果為真 |
string1 != string2 | 如果兩個字符串不同則結果為真 |
-n string | 如果字符串不為空則結果為真 |
-z string | 如果字符串為空(null),則結果為真 |
使用方法如下:
str1="tongye" str2="ttyezi" # 用 test 命令,test 語句的結果將作為 if 的判斷條件,結果為真即條件為真,則執行 if 下面的語句 if test "$str1" = "$str2" ; then .... fi # 用 [ 命令的話,可以這樣,注意 [ 與表達式之間要有空格 if [ "$str1" != "$str2" ] ; then .... fi
if [ -n "$str1" ] ; then
....
fi
使用字符串比較的時候,必須給變量加上引號 " " ,避免因為空字符或字符串中的空格導致一些問題。實際上,對於條件測試語句里的變量,都建議加上雙引號,能做字符串比較的時候,不要用數值比較。
2)算術比較
算術比較 | 結果 |
expr1 -eq expr2 | 如果兩個表達式相等,則結果為真 |
expr1 -ne expr2 | 如果兩個表達式不相等,則結果為真 |
expr1 -gt expr2 | 如果 expr1 > expr2 ,則結果為真 |
expr1 -ge expr2 | 如果 expr1 >= expr2 ,則結果為真 |
expr1 -lt expr2 | 如果 expr1 < expr2,則結果為真 |
expr1 -le expr2 | 如果 expr1 <= expr2,則結果為真 |
!expr | 如果表達式為假,則結果為真 |
使用方法如下:
num1=2 num2=3 if [ "$num1" -eq "$num2" ] ; then ... fi if [ "$num1" -le "$num2" ] ; then .... fi
注意算術比較和字符串比較之間的不同之處,字符串比較比較的是兩個字符串,數字也是能組成字符串的,因此,當我們使用字符串比較的方式和數字比較的方式來比較兩串數字的時候,結果會有些不同。說起來比較拗口,用一個例子來說明一下:
#!/bin/bash val1="1" val2="001" val3="1 " # 字符串 val3 在 1 的后面還有一個空格 [ "$val1" = "$val2" ] echo $? # 使用字符串比較,退出碼為 1,說明兩個字符串不相等 [ "$val1" -eq "$val2" ] echo $? # 使用數值比較,退出碼為 0,說明兩個數值相等 [ "$val1" = "$val3" ] echo $? # 退出碼為 1 [ "$val1" -eq "$val3" ] echo $? # 退出碼為 0
exit 0
需要注意的是,如果在編寫代碼時,變量沒有加上雙引號,上述程序的結果又會不同,僅對 val3 進行取值,將會忽略該字符串中的空格,則第三個表達式的退出碼將為 0 。這也說明了在變量兩邊加上雙引號的重要性。
3)文件條件測試
文件條件測試 | 結果 |
-d file | 如果文件是一個目錄,則結果為真 |
-e file | 如果文件存在,則結果為真。注意,歷史上 -e 選項不可移植,所以通常使用的是 -f 選項 |
-f file | 如果文件存在且為普通文件,則結果為真 |
-g file | 如果文件的 set-group-id 位被設置,則結果為真 |
-r file | 如果文件可讀,則結果為真 |
-s file | 如果文件大小不為 0 ,則結果為真 |
-u file | 如果文件的 set-user-id 為被設置,則結果為真 |
-w file | 如果文件可寫,則結果為真 |
-x file | 如果文件可執行,則結果為真 |
用一個例子演示一下:
#!/bin/bash if [ -f /bin/bash ] ; then echo "file /bin/bash exists" fi if [ -d /bin/bash ] ; then echo "/bin/bash is a directory" else echo "/bin/bash is not a directory" fi
exit 0
五、控制結構
shell 中的控制結構與其他程序設計語言中的控制結構類似,也是由順序結構、選擇結構和循環結構組成。
5.1 if 語句
在上面的例子中,已經多次用到了 if 語句,這里再詳細描述一下 if 語句的語法結構:
if condition1 then statements1 elif condition2 then statements2 else statements3 fi
在 if 結構中,condition 就是我們第三節所說的條件判斷語句。if 語句執行時,先執行 condition ,獲得其退出狀態,若退出狀態為 0(這意味着條件滿足),則執行 then 塊中的語句,否則跳過 then,接下去執行。
如果需要對條件作更進一步的判斷划分的話,可以使用 elif 語句(類似於 else if)。具體的例子上文有許多,就不再單獨寫了。
5.2 case 語句
與其他編程語言中的 case 語句類似, shell 中的 case 語句也可以用來進行模式匹配,語法如下:
case variable in pattern [ | pattern ] ... ) statements;; pattern [ | pattern ] ... ) statements;; ... esac
關於 case 的語法,有以下幾點需要說明一下:
1)case 語句以 case 作為開頭,以 esac 作為結尾;
2)case 語句的每個模式行都是以雙分號 ;; 結尾的;
3)一個模式行可以合並匹配多個模式,使用 | 符作為分隔;
4)一個模式行可以執行多條語句,各語句之間可以使用單分號 ; 隔開,這也是為什么每行的結尾要使用雙分號 ;; 作為結束標志的原因;
5)case 語句支持使用正則表達式作為匹配項,這使得 case 語句的功能更為強大。
#!/bin/bash read -p "please keyin a word:" -t 5 word case $word in [a-z] | [A-Z] ) echo "You have keyin a letter";; [1-9] ) echo "You have keyin a number";; * ) echo "Unknow input" esac exit 0
這段代碼從鍵盤輸入一個字符,然后進行匹配,判斷這個字符是字母還是數字,都不是的話返回未知輸入。
5.3 for 語句
shell 中的 for 語句與 C 語言等的 for 語句格式不一樣,但都是用來循環處理一組值的。這組值可以是任意字符串的集合(shell 在默認情況下所有變量都是以字符串的形式存儲的),它們可以在程序里被列出,更常見的做法是使用 shell 的文件名擴展結果。 for 循環將會重復整個對象列表,依次執行每一個獨立對象的循環內容。對象可能是命令行參數、文件名或是任何可以以列表形式建立的東西。其語法如下:
for variable in values do statements done
for 命令可以執行指定次數的一個或多個命令。在執行循環時,參數列表 values(可以有多個參數,如val1、val2、val3、...) 中的第一個參數將被賦給變量 variable,然后執行循環體(do 與 done 之間的命令);然后將列表中的第二個參數賦給 variable,依次循環,直到列表中的參數用完。舉個簡單的例子:
#!/bin/bash for name in tongye wuhen xiaodong wufei laowang do echo $name done exit 0
這段代碼將依次打印參數列表中的參數。 關於 for 語句,還有許多其他用法,暫不細說。
5.4 while 與 until 語句
如果你需要進行循環操作而是先不知道需要循環的次數,可以使用 while 循環,while 循環的語法如下:
while condition do statements done
until 循環語句的功能與 while 一樣,不同的是對於條件判斷結果的處理上。until 循環的語法如下:
until condition do statements done
在 while 和 until 語句中,condition 是判斷條件,不同的是,while 語句中,若判斷條件為真,則執行循環體;until 語句中,若判斷條件為真,則停止執行循環體。
#!/bin/bash i=1 while [ "$i" -le 10 ] do read -p "please keyin a number:" i done 9 10 echo "$i" 11 12 exit 0
這段代碼從鍵盤中輸入一個數字,直到輸入數值大於 10,退出循環並打印最后輸入的那個值。
參考書籍:
《Linux程序設計 第四版》
《Shell腳本學習指南》
《UNIX/Linux/OS X 中的 Shell 編程 第四版》