相比象形文字,拉丁字母有何優劣?


要不要漢字,這是個重要的問題。
漢字的優點,教科書上通常會這麼寫:

1. 辨別同音字。

2. 超越時間與空間。

3. 與漢語相適應。

(結尾有我就這個問題新擬的答案)

1. 現代漢語普通話有1327種音節(參見我這個答案 普通話里,一個音節只有一種聲調的例子有哪些?),《現代漢語通用字表(1988)》收字7000個,平均每個音節有5個多字。

當然,也有些音節大戶有許多同音字。《現代漢語詞典(第6版)》「bì」這個音節底下有68個字,其中《通用字表》里的有46個。

如果漢語拼音不標調,就只有418種音節了。我們把字數也縮小一些,用《現代漢語常用字表(1988)》收的3500個字,平均下來有8個多字。

所以「辨別同音字」這一條還是很重要的。

但是,有人說,這是漢語的缺點,漢字的所謂優勢也只是彌補這個缺點,功過相抵,所以與拼音文字相比還是沒有優點。

不過漢語這個缺點也不全靠漢字來彌補,詞的雙音化也是應對這個問題。但是這種觀點有一定的道理。

2. 超越空間其實也可以歸在超越時間裡邊。原因是語素意義的變化比語音慢,所以可以「筆談」。

不過像英語同法語就不能筆談么?這一條拼音文字也可以啊,只不過不如漢字那麼強。

超越時間作為一種副作用,又叫文字的歷史負擔。像形聲字聲符準確表音的只有7.1%(范可育等《論方塊漢字和拼音文字的讀音規律問題》1984),讀半邊多是讀不準的。但是像「肥」這樣的聲符雖然讀不準,但是蘊含了語音演化的規律。

有的人就主張扔掉這些歷史負擔,更換新的聲符,像「負擔」的「擔(擔)」字就是這樣。
不過新聲符「旦」還是沒有準確表音。而「賓(賓)、鄰(鄰)、進(進)」這種聲旁的替換簡直就故意不讓南方的朋友分清前後鼻音嘛。

像英語書寫就沒有歷史負擔了么?eight 里的gh 為什麼不發音呢?

除了新換的文字,都是有歷史負擔的,因為文字是第二性的,相對於語言是滯後的。
頻繁地變換文字是不現實的,一是成本高,二還不利於文化傳承。文字的徹底「革命」往往與極權政治有關,而一般的做法是文字「改革」,修修補補,我們稱之為「正字法」。

文字,徘徊於「新」與「老」兩端,一體兩面,謂之守恆。

(用數學的話說,這是一個單調遞減函數在第一象限與坐標軸構成的一個可能性邊界)

這麼看來,漢字的優點很沒有說服力嘛,跟拼音文字相比簡直沒有優勢。

拼音文字的優勢在於「好上手」。英語書寫就26個字母加空格,一維組合。就算完全不懂,依樣畫葫蘆也能在電腦上照抄著輸入。

漢字數量那麼多,根據上面「一體兩面」的守恆定律,應當有「少」的一方面。數量多的反面是什麼少呢?作為中文系的學生,這個問題也困擾著我。

我曾經也並不服上面教科書上的3條,只是用漢字跟一個英語單詞比,用筆畫跟26個字母比。但是由於二維組合無法作「通用的唯一性」分割(只能人為規定),這種比較是沒有實際意義的。如果哪天解決了二維組合「通用的唯一性」分割的問題,就能發明了二維的書面輸入軟硬體,這才把漢字跟單詞拉回到同一輸入層級上。這將又是一場信息革命。

常用漢字就有3500個,部件560個(語委《信息處理用GB13000.1字符集漢字部件規範》1997),其中部首201個(文改會、文化部《統一漢字部首表》1983)。

筆畫雖然只有「橫、豎、撇、點、折」五種(「提」歸「橫」,「捺」歸「點」,「豎鉤」歸「豎」),但是「折」有25種(教育部、語委《GB13000.1字符集漢字折筆規範》2001),總數還比26大。

「人」字加一筆還可以變成「及」,那一筆叫「橫折豎折橫折撇」,簡稱「橫折折撇」。

然後我讀到了趙元任的《語言問題》,這是先生1959年台大中文系演講的記錄。先生介紹了information theory ,即「資訊理論」。

這個理論是Claude Shannon 在1948年的論文A Mathematical Theory of Communication 中提出來的,這也是資訊理論的濫觴。知乎上程序員很多,對於Shannon 你們應該比我一個中文系的熟悉多了。而趙元任,他是康奈爾大學的理學士,主修數學,選修物理和音樂。這是信息時代的新理論,是民國初討論漢字存廢問題不曾考慮到的方面。

(文科生表示數學和物理壓力頗大,但是基本的意思還是能理解)

1)我接下來要寫/ 打一個字,如果你已經100%知道我要寫/ 打哪個字,那我寫/ 打這個字所傳遞的信息為〇。我根本沒必要寫/ 打這個字,我不寫/ 打你也知道,白寫了。

2)如果要寫的字有兩種可能,「是」或「否」。那麼你要是看到我寫了「是」,你本來完全不知道,只知道有50%的可能,而現在你100%知道了。所以這個信息價值100%-50%=50%。

3)要是可能性很多,你完全不知道我要寫什麼,那麼可能的範圍很大。所以寫一個字的機會越少,得出來的信息量就越大。量信息的分量就是量概率(probability)的多少。

4)例子中的百分比只能相對比較,卻沒法用單位來衡量。要用單位衡量信息量的話就要按比例算,就是算對數。資訊理論中一般用以2為底的對數,這樣算出來的單位正好是一個二進位的位(binary digit, bit)。

寫一個英文字,有26種可能,它傳遞的信息量有多少呢?(這裡假設每個字母出現的可能相同;如果不同的話要算加權平均)

同理,寫一個漢字,有3500種可能,它傳遞的信息量有11.8個二進位位。

所以,漢字數量大,它傳遞的信息量也大。傳統上,這叫「微言大義」;現在我們說「內涵·高能」。

這裡說傳遞的信息量大,根據定義可知,是表明不確定性的減少程度。所獲得的信息可能事關重大,也可能無足輕重,這是「信息作用」的大小,不同於「信息量」的大小。比如Brithers Grimm(格里姆/ 格林兄弟)的作品,對於普通人來說,「信息作用」最大的是一部《童話集》。而從「信息量」(字數)衡量,這只是兩位作品的冰山一角,他們還有諸多重要的法學、語言學著作,著名的如《德語詞典》(至Frucht 條)。後人續修完的,我在圖書館看到有14卷29冊

我們回過頭來看上面的第1條與第2條。為什麼漢字能夠辨別同音字?為什麼漢字能夠攜帶更多的歷史負擔?因為信息量大。這是漢字的特點。

漢字信息量大,所以用更少的位數就能表達相同信息量的信息。也就是說,用漢字寫,可以寫得短一些。這就是我們要找的「少」,漢字數量「多」反面的「少」。

我在這個答案里也說了這點 漢字(語素文字)相較於字母文字,有什麼優勢?但是囿於英語水平,對於理論的表達不盡人意,但是其中舉了一個西文與漢字古文字的例子與一個現代漢語的例子具體說明了使用漢字長度相對較短。其中現代漢語的例子並不是與英語相比較,而是與一音位一字的漢語拼音比較。

你會發現英語單詞(實詞)總是很長,尤其是術語。為了縮減,常常用幾個大寫字母代替,但是由於字母有限,有些字母組合就有許多意思。比如NBA ,除了National Basketball Association(國家籃球協會/ 美職籃)這個意思,還可以指3-Nitrobenzanthrone(3-硝基苯並蒽酮)、National Bank Act(《國家銀行法案/ 國民銀行法》)等。

當信息總量非常大的時候,漢位元組約空間的優勢還是很可觀的。

跟生活關係大些的,發簡訊或者微博,只能寫140個羅馬字或者70個漢字。由於漢字的信息量是羅馬字的兩倍還多,所以用漢字還是比較從容,而羅馬字則無法施展。所以英語中有許多簡訊中用的縮寫,像BTW(by the way),Thx(thanks),CU L8r(See you later)等等。

當人們還在石頭上刻劃寫字的時候,寫更少的字具有非常重要的意義,這大概是漢語沒有選擇音位文字的原因。

(除了用這種「高能」的書寫系統記錄,我們的老祖宗在另一個方向上想辦法,就是把書寫材料變得輕便、易於攜帶。我們常說中華文明四大發明,要我說,一樣就夠了,紙。漢字是理論系統的解決方案,而紙是工業技術的解決方案。誰有最先進的information technology,誰就是世界的老大。所以以前是中國,現在是美國。現在IT 的主角是計算機,但是紙並未被淘汰,還有計算機模擬紙張的顯示技術)

但是漢字歷史上出現過往音節文字的趨勢,就是泛濫的假借。按照傳統的小學,「假借」是「六書」之末,總是排在最後。但是高本漢先生把它放在了「形聲」之前。

如果漢字繼續在假借上發展並規範的話,就會像今天的假名一樣。也許是當時漢語音節還比較複雜,而且數量還不少,先賢選擇了在假借字上加上了象形部件來規範漢字,也就成了「形聲」。

雖然漢字中包含象形、指事、會意的象形文字不如形聲字多,但是從形聲字的產生來看,可以明顯看到象形的作用。所以漢字具有象形文字的特點。

上面的「六書」理論建立在一個假設之上,即漢語詞是短小的單音節。它可能有複輔音,韻尾也比較複雜,但是單音節。單音節,再加上相對複雜的音節結構(上古漢語),並不少的音節數量,影響了漢字的方向。如果漢語詞是多音節且音節結構沒那麼複雜的話,泛濫的假借可以往另一個相對高效的方向發展,即輔音文字,像阿拉伯文那樣,只寫輔音,不寫母音(必要時加標註)。這也就是我們上面沒講的第3條,與漢語相適應。如果沒有具體說到與漢語的哪些特點相適應,這就是一句空話。

這裡要指出的是,所謂「特點」,都是比較得出的。漢語音節的數量,同英語比是少,同日語比就是多,是相對的概念。

最後總結,說說我給漢字優點擬的新答案。

1. 單位信息量大。

2. 與漢語相對複雜的單音節結構相適應。


首先糾正一個概念,象形文字是文字的早期形態,它脫胎於原始繪畫,如早期聖書字、早期蘇美爾文字、東巴文等。隨著文字的逐漸成熟,文字形體逐漸線條化、筆畫化,其象形的特徵也逐漸脫落,甲骨文的象形性已經很弱了,聖書字的僧侶體和人民體也不能稱其為真正意義的象形文字,至於現代漢字,則完全脫離了象形的範疇。簡單的說,日寫作「⊙」是象形字,寫作「日」就完全符號化了,這樣的文字則稱為表義字。

以拉丁字母為代表的字母文字,最大的優點就是簡便易學,對不同語言的適應性強。文字的產生是為了彌補語言在時間和空間上的不足,而字母文字在這一點上顯然是不成功的,隨著語音的歷史演變,以記音為手段的表音文字顯然造成的閱讀的障礙,比如現在的英國人,不經過專家的翻譯根本無法讀懂100年前的作品。語言在空間上的差異叫做方言,因為字母文的表音性,方言的分歧會逐漸加大,最終變成兩種不同的語言。

由於現在唯一使用的成熟的表意文字只有漢字,表音字與表意字的差異也基本上等同於漢字和其他文字的差異。所以字母文字的劣勢,也基本上等同於漢字的優勢。

除了前面提到的超時空性,相比與字母文字,漢字擁有以下幾方面的優勢:

1.節省版面空間。有人做過對比,同等字型大小的《戰爭與和平》,俄文版的版面是中文版的5倍。用漢語拼音代替方塊漢字,版面也也會大幅增加,將毛澤東的《為人民服務》一文轉寫成漢語拼音,版面空間增加了2.5倍多。

2.便於高速閱讀。字母文字(或拼音文字)在閱讀上要經過「圖形→聲音→意義」這樣三個步驟,而漢字則只經過「圖形→聲音+意義」兩個步驟,在頭腦中的反應時間明顯要短於字母文字。而且其在版面空間上的優勢也使得閱讀同樣一句話視覺掃描的距離更短,這些都會縮短閱讀的時間。漢字圖形音義一體的結構也更利於跳讀等快速閱讀。

3.漢字是雙通道文字。西方學界普遍認為,文字(拼音文字)是單腦(左腦)文字,人們在閱讀拼音文字的時候,只需要通過左腦完成信息處理。1984年,上海師範大學心理系教授郭可與上海醫科大學華山醫院神經科合作,結合腦損傷病人的臨床研究,得出結論:與偏向於左腦的拼音文字不同,漢字是左右腦並用的復腦文字。在拼音文字的認知中,語音編碼起決定性的作用;而漢字的認知則是語音、語義、圖形多重編碼共同作用。

在閱讀漢字的時候,需要左右腦的共同參與,這就使得中國人的大腦發育更加平衡。1989年美國人口學會的調查發現,中國人的平均智商明顯高於歐美及日本人,並認為漢字及其思維方式是重要的原因之一。

拼音文字作為單通道文字導致的左右腦不平衡發展,也為兒童識字造成了不便,據統計,歐美社會中患有閱讀障礙的兒童高達10%,而在中國則是極為罕見的。1970年,美國賓夕法尼亞州立大學在費城做了一個實驗,教授三十名患有閱讀障礙的八歲兒童認讀用漢字記錄的英語單詞,經過一個月的訓練,參加實驗的兒童全部能夠熟練地用漢字進行閱讀。這一實驗結果於1971年在《科學》雜誌上發表,引起了世界各國的廣泛關注。實驗結果說明漢字的方塊平面空間結構很容易在大腦中形成一個完整的視覺形象,成為語音和語義的有效載體。漢字的抽象性與形象性的雙重特性充分調動了兒童大腦的左右兩個半球,特別是調動的大腦的右半球,使兒童克服了閱讀障礙,並開發了他們的智力。

日本著名教育家石井勛也發現,五歲的幼童根本無法記住假名,但如果教他們表達和生活相關內容的漢字,則幾乎沒有記不住的。石井勛經過研究甚至預言,未來漢字將成為全世界的通用文字。

語言文字的地位,和使用這種語言文字的群體在世界中的地位是成正比的。隨著中國近代以來的百年沉浮,漢語和漢字也經歷著相應的沉浮變幻,從百年前的漢字不滅中國必亡,到未來的世界通用文字,其中況味耐人細品。漢字能否成為世界通用文字,還有待時間的印證,但隨著中國影響力的提高,漢字在世界上必然會扮演著越來越重要的角色。相比之下,國人仍未完全走出1840年以來的民族自卑,仍未樹立起對於自己母語文字應有的自信心。中國人在和中國人聊天說話,仍然夾雜著不必要的英語單詞;我們的民族品牌,仍然採用拉丁字母作為商標,凡此種種令人扼腕。

============================

補充一點:

很多人把方塊漢字和拉丁字母作為同一級別的單位進行比較,說拉丁字母只有26個,而漢字卻數以十萬計如何如何。這樣的對比是不科學的,單個的字母與單個的漢字不在同一層級,不具備可比性。一個漢字所表示的是一個音義結合的語言單位,是一個同時承載著讀音和意義兩種信息的平台;而一個字母,以英文為例,它沒有任何意義,也甚至不能表達固定的讀音,只有和其他字母組合成單詞,人們才會知道它的讀音,進而知道它的意義。因此二者對比沒有價值,如果非要對比,勉強能與字母相對應的,只有漢字的筆畫。


字母的最大優勢是易讀易學,實現文化民主化,打破文化壟斷,這一點是漢字沒法比,使用象形文字民族識字率遠遠比不上使用字母的民族。

字母缺點是一種口音一種拼法,最典型的例子是美式英語同英式英語的差異。而漢字的優勢則是雖然五湖四海各種口音,但漢字的寫法不隨之改變。這有利於文化的統一,是中華文明延續至今的原因之一。


首發 兩個字


拉丁字, 優在簡。

我們的字,不利之處是筆畫多太難,所以才減化。「臺灣", "台灣",何優何劣,一目了然。不過,再怎樣減化也減化不過阿法拜。很明顯,"Taiwan"最容易。沒必要近路在眼前放著不走,偏偏要另闢蹊徑,繞道走遠路。

所謂"信息大",說的太玄虛了。這樣用單位面積丈量沒啥好處。要說大,也是包含在詞兒裡面,而不是字的筆畫裡面。所以不用怕用漢拼丟信息。

用字母的,說寫用詞,所以講究語法,思想清晰。不大亂說亂寫。用漢字的,根據的不是語法,而是文法,往往用字說寫,易犯堆砌,亂說亂寫。我們應該區別語法和文法,說寫用詞,不含糊顛倒。(如何評價「 改造國文教育,從廢除拼音開始 」這一說法?)

漢字形於甲骨竹簡紙張上問題不大,可以多望幾眼,觀看結構,細品毎字深意,然後腦中圈點斷句,再連起來串講一遍,看看作何解妥當。但在廣播影視歌曲里放音放出來,聽時一閃而過,效果就大打折扣了。

拉丁字母還有一殊勝之處,美國用,大多數國家用。許多詞可以萬國通用,不必造詞頂替。不會弄出"兼職工","人文情懷","莫三鼻給","德意志","合眾國"等不三不四的詞兒來;也不會詞典里找不到真身定義,翻得過來,譯不回去,十個人十種解讀。

"高光"耶?"掃一掃光"耶?何不直接說"把這段刪去,highlight,然後 delete 就行了。"

拼音的好處說不完,可一提的還有極大的方便小孩學習。語文課更好的完成應該完成的任務:訓練聽說讀寫和思考。把 priority 放到寫作上,而不是花在寫字上。

對外漢語老師就省心了,教個入門就行了;聽說讀寫深入的,老外在行,訓練有素。我們將會看到很多老外拼音寫的好文章。

注意,漢字不是象形字,而相當於符號文字。如果引用英文原文就不會搞錯。這個譯詞指鹿為馬,歪曲了詞義,也歪曲了事實。漢字絕大部分是形聲字,一半表音,一半示義。音旁和字母的作用沒有兩樣,形旁與其說示什麼義,不如說分別詞形,這就和西洋文也是一樣。只不過我們搞得太複雜,而且沒必要,所以應該現代化,西化,拉丁化,提高效率。

拉丁化辦不辦得到?完全可以。

同音字咋辦?不用管,因為漢語里沒有字。

同音詞呢?不用怕,每種語言都多的是。很好解決。再說,漢語中同音同形的詞並不如專家聲稱人們想像的那麼多,拉丁化只要把個別的詞改一下拼寫法就行了。

對了,漢字的優勢,可以離開語言和語法,可以隨意增減,藝術魅力高。有國際性,任何語言都可用,可看懂。如:

London"s 氣候 is 怖。It"s very 寒 in 冬,you"d better 著 that jumper!

Verdict: 漢字阿法拜並行。

關於現行的漢語拉丁化拼音系統和轉寫,你有什麼評價和改進建議?

La Tui -- a Mandarin Chinese story in Pinyin


推薦閱讀:

有哪些現行的表音文字不屬於腓尼基-希臘-阿拉米體系?
阿拉伯字母是不是從古到今沒有變化(就類似於漢字的甲骨文到簡體中文的變化那類的)?
古埃及聖書體文字是怎樣表達意思的?
丁這個字當姓氏的時候念ding還是zheng?
印刷體(宋體、明朝體)是如何產生的?

TAG:文字 | 拉丁字母 | 比較文字學 |