Linux Shell編程入門
從程序員的角度來看, Shell本身是一種用C語言編寫的程序,從用戶的角度來看,Shell是用戶與Linux操作系統溝通的橋樑。用戶既可以輸入命令執行,又可以利用 Shell腳本編程,完成更加複雜的操作。在Linux GUI日益完善的今天,在系統管理等領域,Shell編程仍然起著不可忽視的作用。深入地了解和熟練地掌握Shell編程,是每一個Linux用戶的必修功課之一。
Linux的Shell種類眾多,常見的有:Bourne Shell(/usr/bin/sh或/bin/sh)、Bourne Again Shell(/bin/bash)、C Shell(/usr/bin/csh)、K Shell(/usr/bin/ksh)、Shell for Root(/sbin/sh),等等。不同的Shell語言的語法有所不同,所以不能交換使用。每種Shell都有其特色之處,基本上,掌握其中任何一種就足夠了。在本文中,我們關注的重點是Bash,也就是Bourne Again Shell,由於易用和免費,Bash在日常工作中被廣泛使用;同時,Bash也是大多數Linux系統默認的Shell。在一般情況下,人們並不區分 Bourne Shell和Bourne Again Shell,所以,在下面的文字中,我們可以看到#!/bin/sh,它同樣也可以改為#!/bin/bash。
利用vi等文本編輯器編寫Shell腳本的格式是固定的,如下:
#!/bin/sh
#comments
Your commands go here
首行中的符號#!告訴系統其後路徑所指定的程序即是解釋此腳本文件的Shell程序。如果首行沒有這句話,在執行腳本文件的時候,將會出現錯誤。後續的部分就是主程序,Shell腳本像高級語言一樣,也有變數賦值,也有控制語句。除第一行外,以#開頭的行就是注釋行,直到此行的結束。如果一行未完成,可以在行尾加上",這個符號表明下一行與此行會合併為同一行。
編輯完畢,將腳本存檔為filename.sh,文件名後綴sh表明這是一個Bash腳本文件。執行腳本的時候,要先將腳本文件的屬性改為可執行的:
chmod +x filename.sh
執行腳本的方法是:
./filename.sh
下面我們從經典的「hello world」入手,看一看最簡單的Shell腳本的模樣。
#!/bin/sh
#print hello world in the console window
a = "hello world"
echo $a
Shell Script是一種弱類型語言,使用變數的時候無需首先聲明其類型。新的變數會在本地數據區分配內存進行存儲,這個變數歸當前的Shell所有,任何子進程都不能訪問本地變數。這些變數與環境變數不同,環境變數被存儲在另一內存區,叫做用戶環境區,這塊內存中的變數可以被子進程訪問。變數賦值的方式是:
variable_name = variable_value
如果對一個已經有值的變數賦值,新值將取代舊值。取值的時候要在變數名前加$,$variable_name可以在引號中使用,這一點和其他高級語言是明顯不同的。如果出現混淆的情況,可以使用花括弧來區分,例如:
echo "Hi, $as"
就不會輸出「Hi, hello worlds」,而是輸出「Hi,」。這是因為Shell把$as當成一個變數,而$as未被賦值,其值為空。正確的方法是:
echo "Hi, ${a}s"
單引號中的變數不會進行變數替換操作。
關於變數,還需要知道幾個與其相關的Linux命令。
env用於顯示用戶環境區中的變數及其取值;set用於顯示本地數據區和用戶環境區中的變數及其取值;unset用於刪除指定變數當前的取值,該值將被指定為NULL;export命令用於將本地數據區中的變數轉移到用戶環境區。
下面我們來看一個更複雜的例子,結合這個例子,我們來講述Shell Script的語法。
1#!/bin/bash2#wehavelessthan3arguments.Printthehelptext:3if[$#-lt3];then4cat<<HELP5ren--renamesanumberoffilesusingsedregularexpressions67USAGE:ren"regexp""replacement"files8EXAMPLE:renameall*.HTMfilesin*.html:9ren"HTM$""html"*.HTM1011HELP12exit013fi14OLD="$1"15NEW="$2"16#Theshiftcommandremovesoneargumentfromthelistof17#commandlinearguments.18shift19shift20#$*containsnowallthefiles:21forfilein$*;do22if[-f"$file"];then23newfile=`echo"$file"|sed"s/${OLD}/${NEW}/g"`24if[-f"$newfile"];then25echo"ERROR:$newfileexistsalready"26else27echo"renaming$fileto$newfile
"28mv"$file""$newfile"29fi30fi31done
我們從頭來看,前面兩行上一個例子中已經解釋過了,從第三行開始,有新的內容。if語句和其他編程語言相似,都是流程式控制制語句。它的語法是:
if …; then
…
elif …; then
…
else
…
fi
與其他語言不同,Shell Script中if語句的條件部分要以分號來分隔。第三行中的[]表示條件測試,常用的條件測試有下面幾種:
[ -f "$file" ] 判斷$file是否是一個文件
[ $a -lt 3 ] 判斷$a的值是否小於3,同樣-gt和-le分別表示大於或小於等於
[ -x "$file" ] 判斷$file是否存在且有可執行許可權,同樣-r測試文件可讀性
[ -n "$a" ] 判斷變數$a是否有值,測試空串用-z
[ "$a" = "$b" ] 判斷$a和$b的取值是否相等
[ cond1 -a cond2 ] 判斷cond1和cond2是否同時成立,-o表示cond1和cond2有一成立
要注意條件測試部分中的空格。在方括弧的兩側都有空格,在-f、-lt、=等符號兩側同樣也有空格。如果沒有這些空格,Shell解釋腳本的時候就會出錯。
$#表示包括$0在內的命令行參數的個數。在Shell中,腳本名稱本身是$0,剩下的依次是$0、$1、$2…、${10}、${11},等等。$*表示整個參數列表,不包括$0,也就是說不包括文件名的參數列表。
現在我們明白第三行的含義是如果腳本文件的參數少於三個,則執行if和fi語句之間的內容。然後,從第四行到第十一行之間的內容在Shell Script編程中被稱為Here文檔,Here文檔用於將多行文本傳遞給某一命令。Here文檔的格式是以<<開始,後跟一個字元串,在 Here文檔結束的時候,這個字元串同樣也要出現,表示文檔結束。在本例中,Here文檔被輸出給cat命令,也即將文檔內容列印在屏幕上,起到顯示幫助信息的作用。
第十二行的exit是Linux的命令,表示退出當前進程。在Shell腳本中可以使用所有的Linux命令,利用上面的cat和exit,從一方面來說,熟練使用Linux命令也可以大大減少Shell腳本的長度。
十四、十五兩句是賦值語句,分別將第一和第二參數賦值給變數OLD和NEW。緊接下來的兩句是注釋,注釋下面的兩條shift的作用是將參數列表中的第一個和第二個參數刪除,後面的參數依次變為新的第一和第二參數,注意參數列表原本也不包括$0。
然後,自二十一行到三十一行是一個循環語句。Shell Script中的循環有下面幾種格式:
while [ cond1 ] && { || } [ cond2 ] …; do
…
done
for var in …; do
…
done
for (( cond1; cond2; cond3 )) do
…
done
until [ cond1 ] && { || } [ cond2 ] …; do
…
done
在上面這些循環中,也可以使用類似C語言中的break和continue語句中斷當前的循環操作。第二十一行的循環是將參數列表中的參數一個一個地放入變數file中。然後進入循環,判斷file是否為一個文件,如果是文件的話,則用 sed命令搜索和生成新的文件名。sed基本上可以看成一個查找替換程序,從標準輸入,例如管道讀入文本,並將結果輸出到標準輸出,sed使用正則表達式進行搜索。在第二十三行中,backtick(`)的作用是取出兩個backtick之間的命令輸出結果,在這裡,也就是將結果取出賦給變數 newfile。此後,判斷newfile是否已經存在,否則就把file改成newfile。這樣我們就明白這個腳本的作用了,Shell Script編寫的其他腳本與此相似,只不過是語法和用法稍有不同而已。
通過這個例子我們明白了Shell Script的編寫規則,但還有幾件事情需要講述一下。
第一個,除了if語句之外,Shell Script中也有類似C語言中多分支結構的case語句,它的語法是:
case var in
pattern 1 )
… ;;
pattern 2 )
… ;;
*)
… ;;
esac
我們再就下面一個例子,看看case語句的用法。
while getopts vc: OPTION
do
case $OPTION in
c) COPIES=$OPTARG
ehco "$COPIES";;
v) echo "suyang";;
?) exit 1;;
esac
done
上面的getopts類似於C語言提供的函數getopts,在Shell Script中,getopts經常和while語句聯合起來使用。getopts的語法如下:
getopts option_string variable
option_string中包含一串單字元選項,若getopts在命令行參數中發現了連字元,那麼它會將連字元之後的字元與option_string進行比較,若匹配成功,則把變數variable的值設為該選項,若無匹配,則把變數的值設為?。有時候,選項還會帶一個值,例如-c5等,這時要在option_string中該選項字母后面加上一個冒號,getopts發現冒號後,會讀取該值,然後將該值放入特殊變數OPTARG中。這個命令比較複雜,如有需要,讀者可以詳細參閱Shell編寫的相關資料。
上面這個循環的作用就是依次取出腳本名稱後面的選項,進行處理,如果輸入了非法選項,則進入"?指定的部分,退出腳本程序。
第二個,Bash提供了一種用於互動式應用的擴展select,用戶可以從一組不同的值中進行選擇。其語法如下:
select var in …; do
break;
done
例如,下面這段程序的輸出是:
#!/bin/bash
echo "Your choice?"
select var in "a" "b" "c"; do
break
done
echo $var
----------------------------
Your choice?
1) a
2) b
3) c
第三,Shell Script中也可以使用自定義的函數,其語法形式如下:
functionname()
{
…
}
例如我們可以把上面第二個例子中第四到第十二行放入一個名為help函數體內,以後每次調用的時候直接寫help即可。函數中處理函數調用參數的方法是,直接用上面講過的$1、$2來分別表示第一、第二個參數,用$*表示參數列表。
第四,我們也可以在Shell下調試Shell Script腳本,當然最簡單的方法就是用echo輸出查看變數取值了。Bash也提供了真正的調試方法,就是執行腳本的時候用-x參數。
sh ?x filename.sh
這會執行腳本並顯示腳本中所有變數的取值,也可以使用參數-n,它並不執行腳本,只是返回所有的語法錯誤。
推薦閱讀:
※系統級程序設計筆記(中)
※技術真的沒用嗎
※Leetcodes Solution 28 Implement strStr()
※【futaba】三、沒有類型是什麼類型
※學編程,要學會CRM