為什麼國際輔助語不用漢字而必須用拉丁字母?——輔助語操作標準(1)文字篇
上一篇文章講述了輔助語該用哪些價值標準去評價,接下來的幾篇文章則會聚焦於語言具體操作當中的各個方面,看看怎樣的設計是更合適的。
在一篇回答當中,我比較概括地描述了如何評價一門語言的學習難度:如何評價學習一門語言的難度? - 路易·羅莎的回答n,其中提到直接通過語言本身去考察語言的難度是比較客觀且可行的,當然這需要我們建立一個良好的模型。不過輔助語並不是只追求易學就可以的,因此這裡的評價體系還需要將上一篇當中提到的其他價值觀引入,以及最重要的一個標準是這麼一句話:
最好的輔助語方案就是在保證自然性、精確性、經濟性沒有受到太多損害的同時儘可能簡單易學的方案。
懂經濟學的人大概可以聯想到帕累托改善,而輔助語的製作就是應當完成這樣一個改善的過程——不損害任何人的利益的同時增加福利。
下面我將分成文字、語音、語法、辭彙四個部分來談談具體操作當中的設計的優劣。本篇我們先來談一個不時有人提出的觀點——「用漢字多好,字形不變,構詞方便,何必再搞什麼世界語。」而顯然,並沒有輔助語選擇使用漢字來作為自己的文字使用,基本上都選擇了拉丁字母作為所使用的文字。原因何在?
很容易理解的原因就是拉丁字母簡單易學,即使完全沒接觸過拉丁字母,也無非學習最多26個字形;但是學習漢字的話沒個三千到四千的積累怕還沒完全脫離「文盲」的隊列,而且每個字型筆畫繁多,無論記憶還是使用都沒有拉丁字母方便。
又有人說了,漢字每個字都代表一個詞,要比較的話對應的應該是使用拉丁字母組合的詞,或者用字母來對應漢字的基本筆畫。這同樣也是謬論。拉丁字母比漢字好學還有一個原因,就是字母是跟發音直接相關的,也就是每個字母就只代表著發音,拼出來讀出來就知道說的是什麼了。而漢字作為表意文字,其字型、發音和意義是分開的三個部分,即使存在大量的形聲字,但其聲旁和發音的關係是多對多的關係而不像拉丁字母通常可以做到一一對應。光是不表音(或不直接表音)這一點,漢字比拉丁字母就要複雜很多。可以回憶一下,我們可能從小學一年級就學習語文和英語兩堂課,學習英語的文字只需要在一年級的開頭階段就完成了;但是學習漢字可以一直學到初中。
說個題外話,雖然說拉丁字母確實比漢字易學,但我堅決反對漢字拉丁化。因為每個語言都有自己最適合的文字,不能夠看到別人用拉丁字母有很多好處,就想把自己民族長期使用的文字更換掉。漢字每個字都是一個語素,漢語的構詞法一直都被中國人稱道。而單音節語素存在大量的同音字,拉丁化的話一來很可能影響理解,二來會顯著降低閱讀效率。而且長期下來很可能就會導致語言也不得不跟著文字進行變化,尤其是網路年代文字的使用頻率是非常高的。而漢字作為一種重要的文化符號也被中國人所重視,很多字的字形都繼承了三四千年的歷史發展,源遠流長;而漢字的字形大多內含玄機,亦博大精深。作為碩果僅存的仍在大量使用的表意文字,使用漢字而非拉丁字母對於世界文化多樣性也有十足的意義。
既然漢字這樣的文字不適合用在輔助語當中,那麼什麼文字最適合呢?會是拉丁字母嗎?
首先,我們得先從文字的類型劃分講起。文字大體可以分為兩個類型:①表意文字(包括最早的象形文字到現在漢字這樣的意音文字);②表音文字。從學習的角度來說,表音文字的難度是顯著要比表意文字要低的,原因在於:一是表意文字數量繁多,每一個詞都有一個單獨的字形,需要單獨學習記憶;二是如前文所講,表意文字並不直接跟發音對應,學習這門語言和這種文字是兩個分開的過程(想想學漢字時要分別學音、形、意,而學西語、意語等拼讀一致的語言的單詞時,通常學習其拼寫和意思就可以了,會發音就會寫)。
而表音文字(或者叫拼音文字)是一個非常大的類別,裡面還有以下幾種類型的文字:特徵文字、音素文字、母音附標文字、音節文字。這四種類型的意思是一個字母所對應的是什麼語音層級的內容,比如音素文字的一個字母對應的就是一個音素,比如字母b代表濁雙唇塞音[b]、字母i代表高前母音[i],拉丁字母、希臘字母、西里爾字母以及諺文(韓文)均為音素文字(但是諺文模仿漢字結構,將一個音節的字母都塞在一個方框里,常讓一些人以為諺文是表意文字)。而音節文字的一個字母對應的是一個音節,最典型的就是日文的假名,如か代表的是一整個音節/ka/。母音附標文字有天城體(印地文使用)、希伯來文、藏文等等,輔音是其主要的字形,而母音則以附標的形式附加在輔音字母上;阿拉伯文接近於母音附標文字,但其正式文本當中常常不標母音,因此一般歸為「輔音音素文字」。特徵文字我們很少能接觸,騰格瓦文(記錄《魔戒》當中精靈語的文字)是最著名的一套,其原理是一個字母對應的是一種發音特徵(如發音部位是唇、發音方法是塞音等等)。
從數量上來說,特徵文字可以用最少的字母表示最多的發音,是最經濟的,不過相比於另外三種文字來說可能不夠直觀。音節文字往往適用於音節結構比較簡單的語言,如日語。如果音節結構複雜的話,其字母數量可以非常可觀,會相當不經濟,也會變得難學。而用音素文字跟輔音附標文字相比的話,輔音附標的劣勢也同樣是表記發音不如音素文字那麼經濟,而且非線性的書寫方式也沒有音素文字那麼直觀。當然,還是那句話,每門語言都有自己最適合的文字,簡單得像道本語這樣的語言,直接套用日文假名都是完全合適的。
由於國際輔助語大多基於歐洲語言尤其是羅曼語,根據其音節結構,我們可以認為音素文字是最適合的文字類型——無論音節是繁是簡都能方便、準確地記錄,而線性、一維的書寫和閱讀方式則相當直觀。
最後的問題便是我們可以選用哪一套文字體系,拉丁字母是不是最適合的呢?先說結論:拉丁字母在表記發音上並非最適合,但是由於在世界上廣泛使用,因此拉丁字母能夠成為幾乎所有國際輔助語都選用的正式文字。
為什麼說拉丁字母在表記發音上不合適?我們可以具體考察一下26個拉丁字母在英語當中的使用,其中有四個字母發音中有/k/,包括c、k、q、x,其中q通常跟u一起表示/kw/,而x則表示/ks/;字母c的話,根據後方的母音發音為/k/或/s/,這兩個音分別是字母k和字母s所代表的發音。光從這一點看,拉丁字母就相當不經濟——這四個字母只保留k恐怕完全不會折損其記音能力。除此之外,在歐洲語言當中廣泛使用的發音/t?/和/?/沒有字母可以直接表示,必須使用字母組合ch和sh,而日爾曼語常用的發音/θ/、/e/也是如此,只能合用一個th(冰島語則有為這兩個音增加專門的字母);幸運的是,英語當中使用字母了j表示/d?/,總算有充分利用拉丁字母之處。
這麼看來,所謂的「26基本字母」有三個是浪費的,卻還缺了兩個可以記錄/t?/和/?/的字母,由此可以看出拉丁字母的記音能力是有一定缺陷的,這給許多輔助語帶來了麻煩,乃至於世界語必須增加輸入不便的「帽子字母」來保證「一字一音」。相比之下,西里爾字母是能完美地做到一字一音的字母系統——沒有完全多餘的字母的同時,能夠完整地表示齦後音:Ч /t?/、Ш /?/、Ж /?/,並且都只需一個字母,甚至一些輔助語當中使用的塞擦音/ts/也有專門的字母Ц來表示,完美地滿足輔助語「一字一音」的追求。
但是為什麼眾輔助語沒有選擇使用西里爾字母而是依然選用拉丁字母呢?原因很簡單,就是因為拉丁字母在世界上被廣泛使用,包括人口眾多、影響力大的英語、西語、法語、葡語等等,甚至一些非印歐語系的大語言都採用了拉丁字母來記錄,像土耳其語、匈牙利語、馬來語/印尼語甚至越南語(嗯,越南國語字很醜),對於世界上最大比例的人口來說,拉丁字母他們都學過,非常熟悉。如果輔助語使用西里爾字母的話,恐怕只有斯拉夫人和俄國周邊的一些國家能夠「即插即用」,而其他的學習者則必須重新學習這一套字母。當然了,在這樣的前提下,「自創字母」的想法也可以被拋棄了——已經被較大的人口使用的西里爾字母尚且無法挑戰拉丁字母的地位,更何況是一套完全沒人見過的全新的字母體系。
(來看看神奇的結合了漢字書法的越南國語字...)
既然輔助語最好選擇拉丁字母,那麼最重要的問題就變成:如何使用拉丁字母?前方啰嗦過,每套語言都有自己適合的文字。包括拉丁字母的正字法,也應當要適合這一門輔助語。
作為輔助語,一個很大的目標就是解決自然語言當中拼讀不一致的問題(想想英語……),所以制定正字法的話通常都會按「拼讀一致」這個原則來進行。從這樣的角度看,因特林瓜語其實可以給差評了。但是世界語的「帽子字母」從一開始到今天都在遭受猛烈批評,這也提醒我們使用字母也需要考慮經濟性,字母最好不要使用任何附標,來保證輸入和使用方便。
由於國際輔助語大多採用羅曼詞源,那麼我們可以先參考羅曼語的常用音系。首先五母音自不必說,拉丁字母可以完整表達:a、e、i、o、u。輔音方面,通常輔助語適合做到的最大規模如下:
b p m nv f (w)
d t n nz s (ts) nl r
? ? (d?) t? j
g k nh
具體選用哪些輔音更好,我會在下一篇當中進行論述。從這個角度來講,世界語的輔音規模實際上過大了的(在世界語批判當中有詳細介紹),根據羅曼語的特點,我認為以下規模的輔音音系便可:
b p nm v f
d t nn z s nl r
(?) ? n(d?) t? j
g k nh
相比於上面的,這裡少了/w/和/ts/,因為在羅曼語當中沒有這兩個發音(或者可以將濁擦音/z/的發音換成/ts/,不影響規模),而齦後音在現代歐洲語言當中應當是必要的,因而至少保留/?/和/t?/,至於/?/和/d?/是否應當加入,則根據每個輔助語自己的情況來定。還有擦音/h/,在現代羅曼語當中並沒有使用,但是輔助語往往還需要參考拉丁語,因而也需將字母h引入進來,使用擦音/h/會比較合適。
接下來根據拉丁字母來給以上輔音進行分配:
b /b/ np /p/ m /m/ v /v/ nf /f/
d /d/ t /t/ nn /n/ z /z/ s /s/ nl /l/ r /r/
g /g/ k /k/ nh /h/
唇、齒齦、軟齶三個部位的發音都能完美地找到可以直接使用的基本拉丁字母,除z和k外的這13個字母在大多數輔助語當中的使用都沒有差異。字母z和字母k存在分歧的一個原因在於:①/z/作為濁擦音對於一些人來說是困難的(如中國人),像德語、義大利語一樣讀/ts/的話反而會方便得多,但是記錄/ts/的話,可能會使用字母c;②/k/的發音在羅曼語當中通常用字母c來表示,但是現代羅曼語當中,字母c遇到i、e無一例外會軟化,可能讀成/s/(法語、葡語)也可能讀成/t?/(意語)甚至是/θ/(西語),如果一定要使用c並且也存在軟化的設定的話,往往需要字母組合qu-來進行配合,用que、qui來表示/ke/和/ki/的發音(注意不像英語讀/kwe/和/kwi/),並且遇到s讀/ks/時會使用x而不會寫成cs。對/z/和/k/使用什麼字母的分歧跟剩下的幾個發音也密切相關:/?/、/?/、/t?/。
如果想要嚴格地達到一字一音的話,那麼/k/肯定用k是最合適的,但是要考慮清楚遇到詞源中的qu-該怎麼處理(如aqua水、quantity數量)。而這麼一來字母c便會空出來,如果沒有/ts/的發音的話,用c來表示/?/或者/t?/都合適。如果用c表示/?/,那麼/t?/可以用tc來表達;而如果用c表示/t?/,那麼/?/可以交給x(像葡語里的x)。剩下的,如果需要區分/?/和/j/(實際上羅曼語當中發音/?/的詞很多就是來源於拉丁語里的j/i,如果是我的話我會推薦不區分,只使用/j/而不使用/?/會更好),那麼/j/就必須交給字母y,而字母j則留給/?/。以上的這些建議的處理方式都比較接近自然語言,使用上不會給人帶來很大的不適感。並且充分利用了26個基本字母的同時保證了一字一音,在標音的準確性和經濟性上都能夠得到高分,但是跟有可能跟詞源在視覺上存在差異,自然性方面不如下面的做法。
如果不嚴格追求一字一音的話,那麼就需要增加一些稍微複雜的拼讀規則來保證拼讀一致(作為輔助語,拼讀一致是一定不能丟的)。最主要的分歧依然是在/k/上,需要確定如何表達/ki/、/ke/以及詞源的qu-該如何處理。最粗暴的方式便是完全用字母c表示/k/(如LFN)。而如果想要更接近於自然語言,可以在後接i、e時改成qui /ki/、que /ke/。當然了,表示/ks/的話也是更適合使用字母x,來保證貼近詞源。雖然增加了q和x兩個字母,但均來自於26基本字母,依然是比較經濟的。而表示/?/和/t?/的話,由於c和x都已經被使用了,因而最好的辦法是使用字母組合sh和ch,畢竟詞源當中實際並沒有/s.h/和/k.h/這樣的發音,使用字母組合sh、ch完全不會破壞拼讀一致的原則。最後的問題便是拼寫為ci、ce的詞如何處理。通常是不推薦軟化為/s/的(會因為跟si、se衝突而破壞拼讀一致),要麼就跟LFN一樣全部發音為/k/,要麼就跟義大利語一樣軟化成/t?/並且規定ch不能後接i、e(如果完全沒有ch的音位的話就更好辦了,/t?/就可以完全成為字母c的條件變體);是否需要字母g跟c一樣有成對的軟化(讀成/d?/),就根據作者自己的需要來定了。
從以上的討論中我們可以體會到,自然和經濟這兩個價值之間的衝突是非常明顯的,如果想要使用的字母少,表示/k/的發音全部併入字母k甚至字母c完全可以,但是就容易跟羅曼詞源在視覺上差異較大而不容易辨別詞源。而如果想要弄得自然一些,那麼很可能就需要增加使用的字母以及一些拼讀規則。當然,作為輔助語,拼讀規則也不至於過分複雜,但會容易落下話柄遭受批評。
除開拼讀不完全一致的Interlingua,世界語之後的輔助語,包括Ido、Glosa、LFN,都基本符合我以上的建議,雖然會有字母組合的存在(如伊多語有sh、ch和qu),但是拼讀上通常沒有設計變化規則,在學習上是完全沒有障礙的。而LFN完全用字母c來表示/k/在後接i、e時會讓人有一些不適應,算是一個小的瑕疵,習慣了之後問題不大。當然,如果一門輔助語能夠在音繫上做得更小的話,安排字母上的壓力還可以繼續減小(如完全沒有單獨的齦後音音位就不必使用字母組合sh和ch)。總體而言,世界語之後的輔助語在使用表音能力上不完美的拉丁字母的方面算是可以讓人放心的了。(至於對世界語的字母的評價,可以參考本專欄《世界語批判》的第二篇文章)
推薦閱讀:
※先問是不是,在問為什麼, 這句話存在問題嗎?
※為什麼在遊戲配音中中文往往聽起來不如英文和日文?
※有哪些只有既懂中文又懂俄文的人才能聽懂的笑話?
※番外,文字簡史
※想自學韓語,可以通過哪些途徑呢?