普通話的音節表和缺失音節
最近幾年發現知乎上有很多人對普通話的缺失音節比較感興趣。起初是成龍霸王洗髮水廣告里的duang,很多人都好奇這個duang聽上去沒那麼糟糕,為什麼普通話里就沒有這個字呢?由此就延伸出了很多相關的話題和討論。這些問題我看了很多,之前也回答過一些,在這裡想匯總一下我的一些看法。
一個語言當中的音不是隨意組合的,一系列的音位搭配限制制約著什麼音能和什麼音放在一起,這就是音位配列 (phonotactics)。音位配列屬於母語者音系知識的一部分,並且母語者能運用該知識對假詞進行接受度判斷。比如說,成龍的duang,就是一個普通話的假詞,它的接受程度,應該還挺高的,以至於有人提問說為什麼它沒有對應的漢字。但是如果我們換一個假詞,比如說wou,它的接受度如何呢?是不是感覺沒有duang那麼順耳了呢?以上的例子說明,音位搭配限制是實際存在的,並能夠引導說話人做出假詞接受度的判斷。
普通話是一個很奇怪的語言,一方面我們的音節結構很簡單,另一方面在這個簡單的音節結構下還是有一大堆音節缺失了。根據端木(2007)的構想,普通話音節結構可以用CGVX來描述,其中C是聲母,G是介音,V是韻腹,X是韻尾。同時,根據他的音位分析,普通話只有18個聲母[p p? m f t t? n l ts ts? s t? t?? ? ? k k? x],3個介音[j w ?],5個韻腹[a ? i u y],和4個韻尾[i u n ?]。j q x因為和z c s,zh ch sh,g k x等是互補分布的,所以從對立的角度不需要額外列為音位。同理,e o 之間也是大致互補的,所以也能合併。這四個成分,只有韻腹是必須的,其他三個可出現或不出現。如果把這些音窮盡搭配,理論上我們可以有(18+1) × (3+1) × 5 × (4+1) = 1,900個音節(注意:本文完全忽略聲調差異)。根據CGVX來確定缺失音節的考慮範圍是很合理的,因為顯然普通話不允許複輔音,也不允許塞音韻尾。[pla] [tik]這種音節,一看就知道普通話不能接受,所以也就不必把他們納入考慮範圍。但是我們知道,實際出現的普通話音節,也就那麼400個左右(蘇新春 和 林進展 2006),只佔了約20%,剩下的80%都不用,這個是很奇怪的。有人說中國人喜歡存錢,所以音節也攢著今後再用… 所以我們好奇怎樣去解釋這大量的缺失音節。
這個問題其實已經討論了六七十年,很多學者都嘗試提出各種各樣的音位搭配限制,這裡我回顧一下Duanmu & Yi (2015)的分析。首先我們看韻母,3個介音[j w ?],5個韻腹[a ? i u y],和4個韻尾[i u n ?]當中,介音和韻尾不是必須的,所以理論上普通話有(3+1) × 5 × (4+1) = 100個可能的韻母,但是實際出現的只有33個,見下表。
這個表中,最左邊是5個可能的韻尾,它們分別與5個韻腹搭配組成25個韻腹韻尾結構。這25個韻腹韻尾組合又分別與三個介音或沒有介音相搭配,最後是100個格子。實際出現的33個韻母用國際音標標註出來(如果不懂國際音標的話非常抱歉,因為本文討論的很多內容拼音表示不出來)。除此以外,[un] [i?] [w??] 加上了括弧,因為[un]=[w?n],[i?]=[j??]。它們之間很相似,不同的人可能有不同的發音,但是本質上是同樣的韻母。[w??]和[u?]其實不相等,但是因為[w??]不能帶聲母,而[u?]前面必須有聲母,所以他們在對立互補上也能視為同一個韻母。
同時,Duanmu & Yi (2015)提出兩個音位搭配限制,一個是*[高][高],另一個是去同化。*[高][高]就是說,兩個具有[+高]特徵的音不能放在一起。那,三個高母音[i u y]和三個介音[j w ?]都在此範圍之內,所以任何相鄰的兩個這樣的音都被排除了,例如[ii] [wi] [?i],等等等等。由表可見這個限制一下子就排除掉51個缺失韻母。第二個限制的意思是,[雙唇]和[舌冠]這兩個特徵不能在介音和韻尾當中重複出現。例如,[jai]是不可以的,因為介音[j]和韻尾[i]都是舌冠音,同時[?au]也不合法,因為[?]和[u]都是雙唇音。注意[?]既是雙唇音也是舌冠音。這條限制繼續排除了8個缺失韻母(表中用「異」字表示)。這樣一來,還有5個韻母沒有被音位搭配限制解釋:[?a] [j?n] [??n] [un] [?ɑ?],也許我們可以認為這些缺失韻母是碰巧的。
接下來我們看聲韻搭配表,也就是音節表。把33個實際出現的韻母和18個聲母加上沒有聲母進行搭配,看看哪些音節出現了哪些音節缺失了。注意,這個表裡沒有j q x,因為我們的預設就是聲母只有18個。Duanmu (2007)把ji qi xi這些音節處理成[tsi] [tshi] [si],那在這裡我也暫且把j q x下面的音節歸到z c s下。
本表數據來自黃伯榮的《現代漢語》第三版,普通話實際出現的音節有392個音節,用加號表示。原書還收錄了[么 m?] [哦 o] [誒 e] [兒 ?] 四個額外音節,本表沒有顯示。理論上,33 × 19 = 627,所以基於這33個韻母,我們期待的是他們能與所有的聲母搭配,那就應該有627個音節,但實際只有392個,還是有40%的音節少了。
關於聲韻搭配,Duanmu & Yi (2015)接著提出了一個限制:聲母和介音的發音器官必須不同。比如說,bua muai這樣的音節沒有,因為聲母和介音[w]都是雙唇音。zhia shie缺失了,是因為捲舌音和介音[j]都是舌冠音。這條限制能排除表中108個缺失的音節。現在,627減去實際出現的392個音節,減去限制排除的108個,減去42個g k x與i ü 相拼的情況,最後剩下85個未被解釋的意外缺失音節。這些碰巧缺失的音節用減號和深灰色格子表示。
Chomsky & Halle (1965) 說,能被音位搭配限制解釋的空檔,可以理解為系統性的缺失音節,而那些不違背任何音位搭配限制的空檔,則應該是意外的缺失音節。反映到說話人的接受度判斷的話,系統性缺失音節應該聽上去非常糟糕,而那些意外缺失音節,接受度就要高得多。這裡最後總結一下:1900個理論音節,*[高][高]排除掉51 × 19 = 969個(因為一個缺失韻母代表了19個缺失音節),去同化排除掉8 × 19 = 152個,聲韻搭配限制排除掉108個,未被解釋的意外音節有5 × 19 + 85 = 180個(5個意外缺失韻母加85個意外缺失的聲韻搭配),3 × 19 + 14 × 3 = 99個與既有形式無法區分(包括不同人的發音差異和音位分析造成的無法區分),最後就是392個實際出現音節。那麼,我們的預測就是,這180個意外缺失音節,接受度應該是挺高的,也就是有人覺得奇怪,為什麼普通話有好多音節沒有對應的漢字的原因。
說了這麼多,我最後想再討論一些更理論性的問題。首先,好多人都跟我說哪個哪個音節少了是因為怎樣怎樣的歷史原因,缺少怎樣怎樣的中古來源。對此我想說的是,呃... 那當然。比如說,上面的聲韻搭配表裡,所有的f都不能和i相拼。這些意外空檔就有一個歷時的解釋:唇齒音是宋朝才發展出來的聲母,他們都是由重唇音在某些韻腹母音的環境下吸收三等介音*j演變而來的。這樣一來,你可以理解成普通話的f它本身就自帶一個[j]介音,所以它就不能再加一個這樣的介音了。表面上看上去就是普通話不允許fi這樣的組合存在。這樣類似的歷史演變,不是說不重要,歷史演變也很重要。只是說,說話人所能聽到的,就是這所有的392個出現的音節,他聽不到每個音節的歷史演變過程。小孩要想習得普通話的音位配列規則,就只能依靠這392個音節,沒人會告訴他們,啊,shong在普通話里是不允許的。所以如果要用歷史演變來解釋缺失音節,你還是得解釋為什麼在宋朝p加上j要變成f,對吧?或者是說,你覺得這些字普通話里沒有,是因為他們少了中古來源,那為什麼這些形式,在中古的時候也沒有呢?所以,共時的,基於語音學原理的解釋,我認為,是一個更好的途徑。比如說,文章中提到的Duanmu & Yi (2015)的三個音位搭配限制,就都有語音學上的解釋。三條限制都屬於「強制曲折原則」(OCP)的變體。這個原則大致意思就是說,世界上很多語言,都不喜歡把相似的東西放在一起,因為這樣容易造成感知上的偏差,所以如果相似的東西放在了一起,就要採取措施避免。而其他的180個意外缺失音節,我們找不到好的語音學解釋,那就不必解釋了,單純把它歸為歷史演變的巧合性結果。但是,如果仔細看的話也不一定,比如說剛剛提到的*fi的例子,或許唇齒擦音在遇上[j]介音時,感知線索會被削弱?從而證明*fi是有語音學支持的系統性缺失音節?這些東西都值得探討。
推薦閱讀:
※為什麼遼寧口音與黑、吉兩省相比相差那麼多?
※樂色(垃圾)的由來?
※為什麼客家話、閩南話、閩東話在維基百科頁面上都使用拉丁化方案?
※為什麼我感覺自己普通話挺標準的,但是周邊的人都說我有台灣腔?
※為什麼常熟話聽起來很高貴?