Mort | Zsh vs. Bash:不完全對比解析(1)
已經有不少人寫過類似「為什麼Zsh比Bash好」「為什麼Zsh比* shell好」的文章了,講解如何配置Zsh或折騰各種oh-my-zsh主題的教程也是一搜一大籮,但是卻極少看到Zsh和Bash這兩個Shell作為腳本語言時的具體差異比較。那麼,這裡就是一篇,從語言特性的角度上簡單整理了兩者一些細微的不兼容之處,供編寫可移植Shell腳本時參考。(僅僅是從我自己過去的經驗教訓中總結出來的,所以應該也是不完全的。)
開始之前:理解Zsh的模擬模式(emulation mode)一種流行的說法是,Zsh是與Bash兼容的。這種說法既對,也不對,因為Zsh本身作為一種腳本語言,是與Bash不兼容的。符合Bash規範的腳本無法保證被Zsh解釋器正確執行。但是,Zsh實現中包含了一個屌炸天的模擬模式(emulation mode),支持對兩種主流的Bourne衍生版shell(bash、ksh)和C shell的模擬(csh的支持並不完整)。在Bash的模擬模式下,可以使用與Bash相同的語法和命令集合,從而達到近乎完全兼容的目的。為了激活對Bash的模擬,需要顯式執行:
$ emulate bash
等效於:
$ emulate sh
Zsh是不會根據文件開頭的shebang(如#!/bin/sh
和#!/bin/bash
)自動採取兼容模式來解釋腳本的,因此,要讓Zsh解釋執行一個其他Shell的腳本,你仍然必須手動emulate sh
或者emulate ksh
,告訴Zsh對何種Shell進行模擬。
那麼,Zsh究竟在何時能夠自動模擬某種Shell呢?
對於如今的絕大部分GNU/Linux(Debian系除外)和Mac OS X用戶來說,系統默認的/bin/sh
指向的是bash
:
$ file /bin/sh/bin/sh: symbolic link to `bash"
不妨試試用zsh
來取代bash
作為系統的/bin/sh
:
# ln -sf /bin/zsh /bin/sh
所有的Bash腳本仍然能夠正確執行,因為Zsh在作為/bin/sh
存在時,能夠自動採取其相應的兼容模式(emulate sh
)來執行命令。也許正是因為這個理由,Grml直接選擇了Zsh作為它的/bin/sh
,對現有的Bash腳本能做到近乎完美的兼容。
/bin/sh
和shebang的可移植性說到/bin/sh
,就不得不提一下,在Zsh的語境下,sh
指的是大多數GNU/Linux發行版上/bin/sh
默認指向的bash
,或者至少是一個Bash的子集(若並非全部GNU Bash的最新特性都被實現的話),而非指POSIX shell。因此,Zsh中的emulate sh
可以被用來對Bash腳本進行模擬。
眾所周知,Debian的默認/bin/sh
是dash(Debian Almquist shell),這是一個純粹POSIX shell兼容的實現,基本上你要的bash和ksh里的那些高級特性它都沒有。「如果你在一個#!/bin/sh
腳本中用到了非POSIX shell的東西,說明你的腳本寫得是錯的,不關我們發行版的事情。」Debian開發者們在把默認的/bin/sh
換成dash
,導致一些腳本出錯時這樣宣稱道。當然,我們應該繼續假裝與POSIX shell標準保持兼容是一件重要的事情,即使現在大家都已經用上了更高級的shell。
因為有非GNU的Unix,和Debian GNU/Linux這類發行版的存在,你不能夠假設系統的/bin/sh
總是GNU Bash,也不應該把#!/bin/sh
用作一個Bash腳本的shebang(——除非你願意放棄你手頭Shell的高級特性,寫只與POSIX shell兼容的腳本)。如果想要這個腳本能夠被方便地移植的話,應指定其依賴的具體Shell解釋器:
#!/usr/bin/env bash
這樣系統才能夠總是使用正確的Shell來運行腳本。
(當然,顯式地調用bash
命令來執行腳本,shebang怎樣寫就無所謂了)
echo
命令 / 字元串轉義Zsh比之於Bash,可能最容易被注意到的一點不同是,Zsh中的echo
和printf
是內置的命令。
$ which echoecho: shell built-in command$ which printfprintf: shell built-in command
Bash中的echo
和printf
同樣是內置命令:
$ type echoecho is a shell builtin$ type printfecho is a shell builtin
感謝讀者提醒,在Bash中不能通過which
來確定一個命令是否為外部命令,因為which
本身並不是Bash中的內置命令。which
在Zsh中是一個內置命令。
Zsh內置的echo
命令,與我們以前在GNU Bash中常見的echo
命令,使用方式是不兼容的。
首先,請看Bash:
$ echo $ echo \\
我們知道,因為這裡傳遞給echo
的只是一個字元串(允許使用反斜杠轉義),所以不加引號與加上雙引號是等價的。Bash輸出了我們預想中的結果:每兩個連續的
轉義成一個
字元輸出,最終2個變1個,4個變2個。沒有任何驚奇之處。
你能猜到Zsh的輸出結果么?
↓↓↓↓↓↓↓↓↓↓
$ echo $ echo \
(゜Д゜*)
解釋稍後。
我們還知道,要想避免一個字元串被反斜杠轉義,可以把它放進單引號。正如我們在Bash中所清楚看到的這樣,所有的反斜杠都照原樣輸出:
$ echo "\"$ echo "\\"\
再一次,你能猜到Zsh的輸出結果么?
↓↓↓↓↓↓↓↓↓↓
$ echo "\"$ echo "\\"
((((((゜Д゜*))))))))))))
這個解釋是這樣的:在前一種不加引號(或者加了雙引號)的情形下,傳遞給echo
內部命令的字元串將首先被轉義,echo \
中的\
被轉義成,
echo \\
中的\\
被轉義成\
。然後,在echo
這個內部命令輸出到終端的時候,它還要把這個東西再轉義一遍,一個單獨的沒法轉義,所以仍然是作為
輸出;連續的
\
被轉義成,所以輸出就是
。因此,
echo \
和echo \\
的輸出相同,都是。
為了讓Zsh中echo
的輸出不被轉義,需要顯式地指明-E
選項:
$ echo -E $ echo -E \\
於是,我們也就知道在後一種加單引號的情形下,如何得到與原字元串完全相同的輸出了:
$ echo -E "\"$ echo -E "\\"\
而Bash的echo
默認就是不對輸出進行轉義的,若要得到轉義的效果,需顯式地指定-e
選項。Bash和Zsh中echo
命令用法的不兼容,在這裡體現出來了。
在Bash中,你可以通過調用外部命令echo
輸出一個字元串:
echo $text
我們知道,Bash會對傳遞給命令的字元串進行分字(根據空格或換行符),然後作為多個參數傳給echo
。當然,作為分隔符的換行,在最終輸出時就被抹掉了。於是,更好的習慣是把變數名放在雙引號中,把它作為一個字元串傳遞,這樣就可以保留文本中的換行符,將其原樣輸出。
echo "$text"
在Zsh中,你不需要通過雙引號來告訴解釋器「$text
是一個字元串」。解釋器不會把它轉換成一個由空格或者
分隔的參數列表或者別的什麼。所以,沒有Bash中的trick,直接
echo $text
就可以保留換行符。但是,如前一節所說,我們需要一個多餘的工作來保證輸出的是未轉義的原始文本,那就是-E
選項:
echo -E $text
從這裡我們看到,Zsh中的變數在傳遞給命令時是不會被自動切分成words然後以多個參數的形式存在的。它仍然保持為一個量。這是它與傳統的Bourne衍生shell(ksh、bash)的一個重要不兼容之處。這是Zsh的特性,而不是一個bug。
通配符展開(globbing)
通配符展開(globbing)也許是Unix shell中最為實用化的功能之一。比起正則表達式,它的功能相當有限,不過它的確能滿足大部分時候的需求:依據固定的前綴或後綴匹配文件。需要更複雜模式的時候其實是很少見的,至少在文件的命名和查找上。
Bash和Zsh對通配符展開的處理方式有何不同呢?舉個例子,假如我們想要列舉出當前目錄下所有的.markdown
文件,但實際上又不存在這樣的文件。在Zsh中:(注意到這裡使用了內置的echo
,因為我們暫時還不想用到外部的系統命令)
$ echo *.markdownzsh: no matches found: *.markdown
Bash中:
$ echo *.markdown*.markdown
Zsh因為通配符展開失敗而報錯;而Bash在通配符展開失敗時,會放棄把它作為通配符展開、直接把它當做字面量返回。看起來,Zsh的處理方式更優雅,因為這樣你就可以知道這個通配符確實無法展開;而在Bash中,你很難知道究竟是不存在這樣的文件,還是存在一個文件名為"*.markdown"
的文件。
接下來就是不那麼和諧的方面了。
在Zsh中,用ls
查看當然還是報錯:
$ ls *.markdownzsh: no matches found: *.markdown
Bash,這時候調用ls
也會報錯。因為當前目錄下沒有.markdown
後綴的文件,通配符展開失敗後變成字面的"*.markdown"
,這個文件自然也不可能存在,所以外部命令ls
報錯:
$ ls *.markdownls: cannot access *.markdown: No such file or directory
同樣是錯誤,差別在哪裡?對於Zsh,這是一個語言級別的錯誤;對於Bash,這是一個外部命令執行的錯誤。這件差別很重要,因為它意味著後者可以被輕易地catch,而前者不能。
想像一個常見的命令式編程語言,Java或者Python。你可以用try...catch或類似的語言結構來捕獲運行時的異常,比較優雅地處理無法預料的錯誤。Shell當然沒有通用的異常機制,但是,你可以通過檢測某一段命令的返回值來模擬捕獲運行時的錯誤。例如,在Bash里可以這樣:
$ if ls *.markdown &>/dev/null; then :; else echo $?; fi2
於是,在通配符展開失敗的情形下,我們也能輕易地把外部命令的錯誤輸出重定向到/dev/null
,然後根據返回的錯誤碼執行後續的操作。
不過在Zsh中,這個來自Zsh解釋器自身的錯誤輸出卻無法被重定向:
$ if ls *.markdown &>/dev/null; then :; else echo $?; fizsh: no matches found: *.markdown1
大部分時候,我們並不想看到這些醜陋多餘的錯誤輸出,我們期望程序能完全捕獲這些錯誤,然後完成它該完成的工作。但這也許是一種正常的行為。理由是,在程序語言里,syntax error一般是無法簡單地由用戶在運行階段自行catch的,這個報錯工作將直接由解釋器來完成。除非,當然,除非我們用了邪惡的eval
。
$ if eval "ls *.markdown" &>/dev/null; then :; else echo $?; fi1
Eval is evil. 但在Zsh中捕獲這樣的錯誤,似乎沒有更好的辦法了。必須這麼做的原因就是:Zsh中,通配符展開失敗是一個語法錯誤。而在Bash中則不是。
基於上述理由,依賴於Bash中通配符匹配失敗而直接把"*"
當作字面量傳遞給命令的寫法,在Zsh中是無法正常運行的。例如,在Bash中你可以:(雖然在大部分情況下能用,但顯然不加引號是不科學的)
$ find /usr/share/git -name *.el
因為Zsh不會在glob擴展失敗後自動把"*"
當成字面量,而是直接報錯終止運行,所以在Zsh中你必須給"*.el"
加上引號,來避免這種擴展:
$ find /usr/share/git -name "*.el"
字元串比較
在Bash中判斷兩個字元串是否相等:
[ "$foo" = "$bar" ]
或與之等效的(現代編程語言中更常見的==
比較運算符):
[ "$foo" == "$bar" ]
注意等號左右必須加空格,變數名一定要放在雙引號中。(寫過Shell的都知道這些規則的重要性)
在條件判斷的語法上,Zsh基本和Bash相同,沒有什麼改進。除了它的解釋器想得太多,以至於不小心把==
當做了一個別的東西:
$ [ foo == bar ]; echo $?zsh: = not found
要想使用我們最喜歡的==
,只有把它用引號給保護起來,不讓解釋器做多餘的解析:
$ [ foo "==" bar ]; echo $?1
所以,為了少打幾個字元,還是老老實實用更省事的=
吧。
同樣用一個簡單的例子來說明。Bash:
array=(alpha bravo charlie delta)echo $arrayecho ${array[*]}echo ${#array[*]}for ((i=0; i < ${#array[*]}; i++)); do echo ${array[$i]}done
輸出:
alphaalpha bravo charlie delta4alphabravocharliedelta
很容易看到,Bash的數組下標是從0開始的。$array
取得的實際上是數組的第一個元素的值,也就是${array[0]}
(這些行為和C有點像)。要想取得整個數組的值,必須使用${array[*]}
或${array[@]}
,因此,獲取數組的長度可以使用${#array[*]}
。在Bash中,必須記得在訪問數組元素時給整個數組名連同下標加上花括弧,比如,${array[*]}
不能寫成$array[*]
,否則解釋器會首先把$array
當作一個變數來處理。
再來看這段Zsh:
array=(alpha bravo charlie delta)echo $arrayecho $array[*]echo $#arrayfor ((i=1; i <= $#array[*]; i++)); do echo $array[$i]done
輸出:
alpha bravo charlie deltaalpha bravo charlie delta4alphabravocharliedelta
在Zsh中,$array
和$array[*]
一樣,可以用來取得整個數組的值。因此獲取數組的長度可直接用$#array
。
Zsh的默認數組下標是從1而不是0開始的,這點更像C shell。(雖然一直無法理解一個名字叫C的shell為何會採用1作為數組下標開始這種奇葩設定)
最後,Zsh不需要藉助花括弧來訪問數組元素,因此Bash中必需的花括弧都被略去了。
關聯數組Bash 4.0+和Zsh中都提供了對類似AWK關聯數組的支持。
declare -A arrayarray[mort]=foo
和普通的數組一樣,在Bash中,必須顯式地藉助花括弧來訪問一個數組元素:
echo ${array[mort]}
而Zsh中則沒有必要:
echo $array[mort]
說到這裡,我們注意到Zsh有一個不同尋常的特性:支持使用方括弧進行更複雜的globbing,array[mort]
這樣的寫法事實上會造成二義性:究竟是取array
這個關聯數組以mort
為key的元素值呢,還是以通配符展開的方式匹配當前目錄下以"array"
開頭,以"m"
、"o"
、"r"
或"t"
任一字元結尾的文件名呢?
在array[mort]=
作為命令開始的情況下,不存在歧義,這是一個對關聯數組的賦值操作。在前面帶有$
的情況下,Zsh會自動把$array[mort]
識別成取關聯數組的值,這也沒有太大問題。問題出在它存在於命令中間,卻又不帶$
的情況,比如:
read -r -d "" array[mort] << "EOF"hello worldEOF
我們的本意是把這個heredoc賦值給array[mort]
數組元素。在Bash中,這是完全合法的。然而,在Zsh中,解釋器會首先試圖對"array[mort]"
這個模式進行glob展開,如果當前目錄下沒有符合該模式的文件,當然就會報出一個語法錯誤:
zsh: no matches found: array[mort]
這是一件很傻的事情,為了讓這段腳本能夠被Zsh解釋器正確執行,我們需要把array[mort]
放在引號中以防止被展開:
read -r -d "" "array[mort]" << "EOF"hello worldEOF
這是Zsh在擴展了一些強大功能的同時帶來的不便之處(或者說破壞了現有腳本兼容性的安全隱患,又或者是讓解釋器混亂的pitfalls)。
順便說一句,用Rake構建過項目的Rails程序員都知道,有些時候需要在命令行下通過方括弧給rake
傳遞參數值,如:
$ rake seeder:seed[100]
Zsh這個對方括弧展開的特性確實很不方便。如果不想每次都用單引號把參數括起來,可以完全禁止Zsh對某條命令後面的參數進行glob擴展:(~/.zshrc
)
alias rake="noglob rake"
嗯,對於rake
命令來說,glob擴展基本是沒有用的。你可以關掉它。
分號與空語句
雖然有點無聊,但還是想提一下:Bash不允許語句塊中使用空語句,最小化的語句是一個noop命令(:
);而Zsh允許空語句。
剛開始寫Bash的時候,總是記不得什麼時候該加分號什麼時候不該加。比如
if [ 1 ]then :fi
如果放在一行里寫,應該是
if [ 1 ]; then :; fi
then
後面是不能接分號的,如果寫成
if [ 1 ]; then; :; fi
就會報錯:
bash: syntax error near unexpected token `;"
解釋是:then
表示一個代碼段的開始,fi
表示結束,這中間的內容必須是若干行命令,或者以分號;
結尾的放在同一行內的多條命令。我們知道在傳統的shell中,分號本身並不是一條命令,空字元串也不是一條命令,因此,then
後面緊接著的分號就會帶來一條語法錯誤。(有些時候對某個「語言特性」的所謂解釋只是為了掩飾設計者在一開始犯的錯誤,所以就此打住)
在Zsh中,上述兩種寫法都合法。因為它允許只包含一個分號的空命令。
$ ;
當然,因為分號只是一個語句分隔符,所以沒有也是可以的。這種寫法在Zsh中合法:(then
的語句塊為空)
if [ 1 ]; then fi
第二彈
其實只是先挖個坑而已。我也不知道有沒有時間寫,暫且記上。
Zsh vs. Bash:不完全對比解析(2)
推薦閱讀:
※【Bash On Windows】在 Windows Subsystem for Linux(WSL) 上運行任何桌面環境(已達可用階段)
※20.6 Shell 循環表達式 (從新手到菜鳥的Linux教程)
※Terminal中用Excel打開特定文件
※Mac 所有命令失效的解決辦法
※使用Git Bash從Git上下載代碼到本地以及上傳代碼到碼雲Git