為什麼漢語是世界上最先進的語言

作者:冷酷的哲學

河裡曾經不止一次吵過這個話題:漢語究竟是不是落後於英語。但是很多人都沒有講到點子上。我就用點通訊和數據存儲上的概念來聊聊為什麼漢語是世界上最先進的語言——沒有之一。

一、起源

這世界上,仍然在廣泛使用的表意文字,恐怕就只有中文了。而表音文字大行其道。有的人認為這意味著表音文字是更先進的文字,所以表音文字戰勝了表意文字。事實上幾十年前的前輩們很多都是這麼看的。他們曾經提出漢字拼音化的方案,準備把漢語也變成一種表音文字。

事實上,單從兩者的發展歷史,是得不到這個結論的。

文字,從一開始就是記錄信息用的。原生文明,無論中國、古埃及、古印度還是兩河流域,甚至是瑪雅,其文字都是象形文字。換句話說,一開始都是表意的。當文字發展到一定程度的時候,原有的字元無法滿足表達的需要,就會衍生出新的文字。這些新的文字往往由表音的部分和表意的部分合併而成。無論是早期漢字還是古埃及的聖書體都有這樣一個特點。這是文字擴展的必然過程。但表意文字仍然是表意文字。從某種意義上來說,原生文明的語言都是基於表意文字的。

而次生文明則基本都是表音語言。比如希臘、比如日本。有人推測,這是因為次生文明需要從原生文明中學習很多的東西,包括大量的辭彙。運用這些辭彙最簡單的方法就是直接用原生文明的發音來指代。而次生文明因為嚴重依賴於原生文明的詞語發音,自己語言里那種發音恐怕是表不出來什麼意思的。所以最終不得不使用一套表音文字體系來使得自己原有語言與從原生文明進口的大量辭彙兼容。這種被迫囫圇吞棗的做法,我們可以看到也是今天表音文字的本能行為。比如日文「計算機」 就是Computer的音譯。

那麼為什麼這世界上的表意文字這麼少呢?很顯然,這世界上的原生文明本來就那麼幾個,而次生文明卻要多幾個數量級。歷史大潮中三十年河東三十年河西,原生文明也有可能被次生文明所征服。在征服之後,語言也就有可能會逐漸消亡了。如果我們回頭去看看,消亡了的表音文字比表意文字可是要多得多。

所以,表音文字廣泛使用,這並不說明表音文字就優秀。只能說這世界上的原生文明實在太少。

如果要正兒八經討論一種語言的優劣,就必須從兩個角度來討論,第一是語音,第二是文字。

二、語音

之所以要先講語音,是因為所有的語言都是從口語發展出來的,書面的文字,實際上是語言的一個記錄工具,而口語的核心就是語音。

語言水平高低的評判準則

口語,放在今天來分析,實際上是一種通訊協議。就是說,語言實際上是把人的思想通過發音器官變成一串頻率不同、波形不同的聲波,然後有另一個個體的聽覺器官和相關的腦部組織重新轉變回思想。通訊協議,就是一個規則,一個規定了應該如何把思想/信息轉變為易於傳輸的信號的規則。計算機上,通訊協議基本上有這麼兩個評判標準:傳輸效率和抗噪能力。所謂傳輸效率,是說,在單位時間裡,按照該通訊協議能夠傳輸多少信息。所謂抗噪能力,是說這種通訊方式能夠在多大的噪音下仍然保證絕大多數信息正確傳輸。

傳輸效率又有兩個方面,一個是編碼效率,一個是傳輸速度。編碼效率是說,這個通訊協議能夠把一個信息用多短的一串信號來表達。傳輸速度是說一段信號,能夠以多快的速度傳輸。

評價一種語言的口語是否先進,就要分析上面這幾個問題。

傳輸的絕對優勢:聲調

首先從編碼效率上,我們可以說漢語就是世界上編碼效率最高的語言,沒有之一。漢語發音有三大要素:聲母、韻母、聲調。一般的語言只有兩個要素:聲母的韻母。從編碼上說,漢語發音的表意能力就比一般語言高出一個維度。高出一個維度的價值就在於,使用單個音節,漢語能夠表達的不同信息的種類,最高可以達到一般外語的4倍。為什麼外國人學漢語學得這麼辛苦,而中國人學英語則沒有那麼辛苦,就是中國人是已經學會了高級的,現在再去學低級的,而外國人是相反。在學習漢語中,外國人最吃力的問題之一就是聲調,因為這是要在他們習慣的表意能力上提升一個維度。

由於有了聲調這個優勢,理論上漢語的傳輸效率最高就可以達到一般外語的4倍。一般外語,雖然已經開始有意識地使用聲調,但是效率非常低,往往一個句子中最多只用一個到兩個音調錶達諸如疑問、強調等作用。這還只是處於聲調應用的初級階段。遠遠無法與漢語相比,漢語在幾乎每個發音上都應用了聲調。

但是有人說,古漢語聲調更多啊,至少有9 個聲調,難道漢語越發展越回去了么?這當然是錯誤的。漢語是一直向前發展的。那麼,問題出在哪裡呢?問題就在於,聲調並不是越多越好(我們也要在下面講到,發音種類也並不是越多越好)。聲調的種類,取絕於人類發音器官的發音能力。有一些聲調,比如吸氣音,雖然也是在聲調的維度上添磚加瓦,但是發音速度比我們今天的4個聲調就低了很多,換句話說就是,與其用吸氣音來表意,不如直接用兩三個其他聲調的音來表意。所以被淘汰了。還有一些聲調由於與其它聲調區分度不夠大,就逐漸合併了。今天我們在一些地方方言里,仍然能聽到一些特別的聲調。但是這些聲調往往要麼要求特別的器官運動,要麼要求有輕音支持。它們都在逐漸消亡。

資訊理論角度上的絕對優勢

漢語在傳輸效率方面帶來的優勢,在文化中就進一步帶來了更大的優勢。

從資訊理論角度來考慮,編碼是很有學問的。舉個例子。我們知道計算機傳輸信息,實際上傳輸的都是0和1。那麼,如果我們傳輸的各種信息出現的頻率不一樣高怎麼辦?答案是,出現越頻繁的,編碼越短。這樣就能提高總體效率。

比方說,我們只有四種信息要傳遞。按一般的想法,自然是把這四種信息分別用00、01、10、11來表示。每個信息都需要用兩位二進位數來表示,也就是說傳播100條信息需要發送200個二進位數。但是如果其中有一種信息出現的概率是91%,而另外三種分別是3%。那麼就可以使用另一種編碼方式:1,01,001,000。平均下來這種傳播方式傳播100條信息需要發送91+2*3+3*3+3*3=115個二進位數。顯然比前面那種效率要高。

因此,你會發現各個語言中越常用的詞,一般就越短。英語里,我、你、他、她、我們,都是單音節詞。

但是,單音節終歸是有限的。絕大多數意思還是要用雙音節或更多來表示。這時候漢語的優勢就顯示出來了。由於漢語所能承載的單音節詞比其他語言多幾倍,所以在構成多音節詞的時候就可以很奢侈地使用邏輯結構。這種邏輯結構,使得中文的聯繫性、邏輯性要優於一般語言。而與語音脫離的文字體系,則進一步支撐了這種結構,方便了記憶。

很多其他語言,由於缺少單音節詞,所以一般常用詞只能使用雙音節詞。而要形成邏輯結構就必須大規模使用四音節詞。這是非常低效的。為了避免這種低效,很多常用的詞就只能拋棄邏輯結構,用毫無關係的雙音節或三音節詞表示。

比如我們可以很輕鬆地說「公雞」、「母雞」、「小雞」、「雞蛋」。而英語里就成了「Cock」、 「Hen」、 「Chick」、 「Egg」。類似的發音長度,中文能負擔起邏輯結構,而英文就負擔不起來。

所以說,類似長度的詞,中文一般都要比英文的邏輯要更清晰。這不簡簡單單是是效率的問題,而更是人民接受信息能力的問題。組詞方式越短、越有邏輯性,學習就越簡單。整個社會效率就越高。學習、記憶什麼叫Laser,遠不如「激光」那麼簡單。

我們來舉一個非常簡單的例子。普通中國人的初等數學能力往往超過歐美。這並不簡簡單單是教育的問題。更關鍵地,這是中文對數字命名結果。

中文由於漢語在單音節詞上無可匹敵優勢,可以極度奢侈地給予每一個數字一個單音節發音。沒有音調的語言,是不可能做到這一點的,因為還有其他更常見的東西需要佔用寶貴的單音節詞的資源。

人對數字的短期記憶,實際上是對數字發音的記憶。研究表明中國人一次能夠記住的數字長度要高於英語母語國家。而在計算中,你需要短期記憶很多數字,這一點就天然地給予了中國人絕對優勢。

更進一步,中國的數字都是單音節,因此可以採用絕對邏輯的方式構建整個數字表。九十六,就是九個十加一個六。英語是「九十」(與九和十都不同的特殊詞)加一個六。法語是四個二十加十六。漢語種最簡潔而最富邏輯的結構,在世界各種主要語言中是獨一無二的。九九乘法口訣表,就是構建在這個基礎上的。其他國家的兒童如果想背下來這張表,可以說比中國兒童難了幾倍。語言上具備了這種優勢,中國人的初等數學怎麼能不好?就初等數學上的優勢,乘以初等數學在整個社會中的價值,這就是中國的根本競爭優勢之一。

當然,這裡還是要提一下,在比較長的單詞上表音文字當然也是有邏輯結構的,這是語言發展的必然結果。比如說英文nephritis,就來源於希臘語中一個讀音類似的詞,而希臘語中的那個詞則來源於希臘語Nefros和itis,也就是「腎」和「炎」。不過很抱歉的是,由於表音能力差,這些很常見的意思必須要用這麼多音節來表達。這就遠不如中文簡簡單單的「腎炎」了。

此外還需要提到,由於漢語具有遠超其他語言的龐大單音節詞庫,因此在對特定名詞進行縮寫的時候,就更具有無可比擬的優勢。表音語言在對名詞縮寫時,一般只能取首字母,這非常容易引起歧義。而中文可以直接取整個名詞中比較具有代表意義的字,可以極大地消除歧義。比如美國人說「國安局」就是「NSA」,中文三個音節,英文四個音節,結果中文比英文清晰得多。

最強抗噪能力:完全拋棄輕音

從發音種類上說,漢語的發音種類是比較多的。如果你注意日語的話,日語裡面就沒有r這個聲母,發音種類就比漢語少。但是日語從漢語學到了一個巨大的優勢,那就是基本拋棄輕音。

剛才我說到漢語發音種類比較多,可能有人就開始皺眉頭了。因為如果不考慮聲調,英語里獨立發音的種類其實比漢語里還多。因為英語聲母可以單獨成音。而漢語里是沒有的。

事實上,古漢語中輕音也是極度常見的。但是為什麼我們都拋棄了呢?因為一個簡單的原因:抗噪能力差。一個輕音,距離稍微遠一點,或者噪音稍微大一點,就聽不見了。而一個輔音和一個母音組成的音節,則由於母音的存在而有較強的信號強度,更容易正確傳輸。

有一個搞笑論調是這麼說的,"我們的普通話叫「mandarin」,什麼意思啊?滿大人,滿族人清朝入關之後,說不出我們的口語,他就把很多調去掉了,把入聲去掉了,說的發音越來越簡單了。然後逼著全國人都這麼說。所以我們現在的口語比粵語要簡單得多。"

這是一個非常愚昧的論調。首先,Mandarin這個英語單詞來自於葡萄牙語mandarim,葡萄牙語這個詞又來源於馬來語mntri,馬來語這個詞來源於梵語mantrin,而梵語這個詞的意思是官員。換句話說,mandarin的願意是「官話」。而且Mandarin這個詞能查找到的最早的記錄出現於 1589年。大家可以查查那時候「滿大人」在哪裡呢。

很多人以為粵語是正宗的漢語發音。這話對,也不對。粵語具備一些中古漢語的發音特徵。但是也正是因為如此,它才落後於北方官話。有人認為北方官話的形成,是因為蠻族入侵「污染」了漢語。這個說法同樣,對,也不對。北方官話之所以在中古漢語的基礎上進一步的發展,就是因為戰爭與征服,北方漢民與語言不通的外族加深的了交流,多種族的融合,教育,最終拋棄了難發或者影響發音效率的音調。所以,你不能說一種方言既古老又高級。這兩個是矛盾的。

我們舉一個例子。白菜,這個發音在北方官話里是Bai2 Cai4,在粵語里是Baak6 Coi3。你注意到粵語「白」這個發音里有一個k的輕尾音。這個音在北方官話里徹底拋棄了。輕尾音抗噪能力不佳,它的很容易被噪音蓋過,發清楚這個音需要花費額外的時間,而漢語的冗餘度造成一個輕尾音發不準也不會影響整個意義的表達。所以大家可以注意到,隨著廣東地區對外交流的日益增加,年輕的粵語使用者往往採用「懶音」,也就是說,在日常會話中大量拋棄輕尾音。更進一步,菜這個音,粵語里實際上要發兩個音,一個是co一個是i。所以coi這個發音,註定沒有北方官話的cai效率高。所以,覺得粵語是更正宗的中古漢語,這沒錯,但要是覺得粵語更先進,那就大錯特錯了。同樣一個來源的幾個語音體系,使用的越廣泛、交流的越多,其發展就越快。這是必然的道理。

現代漢語普通話,發音一個蘿蔔一個坑,一個輔音配一個母音(當然也有少量單獨母音),發音強度大,效率高。這就是現代漢語的優點之一。

提高傳輸速度:懶化

那麼再比較一下英語和漢語。從口語角度講,漢語的核心優勢在於語調。英語中一個發音,大致有三個要素:聲母、韻母、長度。英語中的語調,是用整個詞的調子或者整個句子的調子來表達單個言外之意,所以僅僅對口語起支撐作用。現今英語的發展潮流中,長度的要素逐漸消亡。長度要素,是通過發音的長短來改變發音的含義,理論上說長度的變化只能在一個基本單位音長和兩個單位音長之間變化,長於兩個單位音長,就失掉了經濟性,從效率上講,不如直接用兩個音替代。事實上,英語中,長度變化,只有兩種:短音和長音。而長音本身,從發音效率上講是低效的。因此隨著英語的廣泛散布,長短音的差距越來越小。甚至很多英語母語國家的人講英語都不管長短音的差異。比方說,sheep的那個i:的音已經見不到人專門拖長了,美國人發這個音基本都是短音i(有的人為了與ship區別,把那個sh發的有點像漢語拼音里的x)。再比如美國人日常對話里說I don"t know的時候,Don"t的那個t的發音常常是省略的。

此外,英語中包含有一些發音效率很低的音,比如th清音(就是three的th)。有一次在收音機里聽見廣告提到了一個電話號碼,這個號碼是 833-3333。大家可以試一下嚴格按照th清音的時候,這個電話號碼讀出來有多費勁(Eight Three Three, Thirty Three Thirty Three)。th這個音我一般都發成s的音,幾乎沒有產生過誤解。還有,比如L這個字母,理論上發音的時候舌尖要頂住上齶,實際上沒發現有幾個美國人是這麼發音的。整個英語發音規則,隨著廣泛的傳播,而迅速的「懶化」。換句話說就是發音規則向快速、高效發音方向發展。但是英語在發音上仍然是落後的。

我們反過來看漢語。漢語經歷了長期、大範圍的傳播。因此發音普遍比較簡單。目前漢語里與標準發音規則不同的「懶化」是比較罕見的。但是依然存在。舉個簡單的例子。「誰」這個音,按照漢語標準發音規則,應發為「shui」,而實際上,大多數人發的音是「shei」。為什麼呢?很多人可能都沒有意識到,但是我一講立刻就能明白:「shui」這個音要求嘴唇作大範圍的運動,而「shei」這個音則不需要。這個區別的核心在於ui和粵語中的oi一樣,都是兩個不同的母音結合在一起,需要用兩個唇舌動作來發,而ei實際上是一個特殊的母音,而不是兩個母音(當然,你也可以把它發成兩個母音的結合,只不過一般說話沒人願意那麼費勁)。所以在大量的使用中,「shui」就逐漸懶化成為了「shei」。

總的來說,漢語所有的發音,通常都能可以以極快的速度發出,絕不會有諸如小舌音那種效率極低的東西存在。所以漢語的傳輸速度也是首屈一指的。

側面的證明:唇舌運動

那麼我們最後回過頭來看,漢語由於拋棄了輕音而具備了較高的抗噪能力,並拋棄了大量不容易發的音。因此與其他語言相比,漢語具有極高的先進性。那麼有人問,這些都是空的,有沒有直觀的東西能證明漢語的優越呢?

有的。出了國,尤其是到了歐美的人,就會發現一個問題。那就是中國人說英語,相比於當地人來說,總有點含混不清。外語老師總是要求中國人說英語的時候嘴巴要張大,舌頭要有力,甚至要求用說話時咬住一根鉛筆的方式來訓練。這是為什麼呢?因為中國人已經習慣了唇舌微微運動的發音過程。漢語的高抗噪能力,使得發音不必費力,唇舌運動幅度比英語之類明顯小。很多要求唇舌大幅度運動的音節構成(諸如前面說的英文33),都已經在漢語里看不到了。

所以,從一個通訊協議的角度看,漢語的語音顯然對諸多其他語言更先進。傳輸效率高、抗噪能力強。

文字

雖然我們的語音可以說是世界上最先進的。但文字角度則沒有那麼清晰。語音可以說是一種通訊協議。那麼文字就可說是一種數據存儲格式。存儲格式的要求與通訊協議不同。存儲格式要求存空間小、讀寫速度快。

不過,我們首先要說一個最基本的問題。正是因為漢字本身與讀音沒有必然聯繫,才給予了漢語語音不斷成長的基礎。才能衍生出漢語這一當今最先進的語音體系。表音文字,總是把語音禁錮住,也就因此很難成長了。當然,這也帶來了學習困難的問題。但是相比於漢字帶來的其他優勢,這實在算不了什麼。

語言的分類

這個世界上的語言大致分為兩種,一種叫做綜合語,一種叫做分析語(或稱孤立語)。

簡單地說,綜合語可以通過改變詞的形態來表達不同的意思。而分析語則單純通過詞與詞之間的關係來表達不同的意思。

我們舉個簡單的例子:

中文(分析語):我昨天告訴他了。

英文(綜合語):I told him yesterday.

英文你首先可以看到told和him兩個變形。其中把tell變成told表示過去發生的動作,把he變成him表示客體。而中文用昨天來直接指明時間,如果不指明時間則需要用「已經」、「過」之類來表示過去,而並不改變詞的形態。中文還通過各自的位置來體現誰是主體誰是客體。

實際上,英語已經是綜合語中非常接近分析語的了。比方說英語的未來時態用的詞形和一般時態沒有區別。而很多其他語言中不同的時態都是用不同的詞形來表達的。在比方說英文對於各個詞的位置有明確的規定。而很多其他綜合語,諸如拉丁語中,詞的位置可以不固定。換句話說就是可以說出這樣的句子:Him yesterday told I。然後通過詞形里的主格詞形和賓格詞形來判斷究竟是誰告訴了誰。 這是非常糟糕的,因為在讀取的時候,總是有先後的差別。我們希望的讀取順序是:先讀取我們的大腦需要先處理的部分。分析語天然就有這種優勢。很多綜合語在逐步的發展中也確立了類似的規則,比如拉丁語的後裔之一——法語。

總結一下。為什麼大致上講分析語優於綜合語呢?因為分析語簡單易懂。首先分析語不存在詞形變換,因此一個詞只有一個形態。學習者不需要記憶其他的變形。中文裡我們從來就不需要記什麼時態、賓格、陰陽詞形。第二,分析語中,各個詞的位置邏輯關係相對明確,在接受信息時更容易理解。更進一步講,由於沒有詞形變化,分析語對於音節資源運用更加有效。英文里單音節詞的資源本來就很有限,結果諸如See和Saw這樣的不規則變形還要多佔用一個。這就是雪上加霜了。所以英文的表達效率與邏輯性遠不能和漢語相比。

從世界範圍內來看,語言都是從綜合語開始,逐漸向分析語發展。

比方說,現代法語的詞形變化規則已經大大簡化了。美國英語在英國英語的基礎上進一步簡化了詞形變化。比方說Goose的複數是Geese,但是美國有很多人就用Gooses。詞綴的含義逐漸單一化,特定含義針對的詞形變化也逐漸單一化。各詞在句子中的位置逐漸固化。我們學習英文的時候,一般都能發現,以英文現在的單詞表,直接把它轉化為綜合語是完全可以做到的事情。那樣它將更便於學習。這就是分析語對綜合語的優勢。

壓縮存儲:分析語的高超之處

當年計算機發展到了新的時代,人們開始研究如何在計算機上存儲視頻文件。一開始的方案極其簡單,就是把一幀一幀圖像全部都存儲下來。但是這無疑是低效的。因為這裡面的冗餘信息太多。舉個簡單的例子。一個夜晚的場景,畫面上很多地方都是黑的。何必把每一個點的色彩反覆記錄呢?所以接下來的一個思路就是,不再存儲每一幀圖像的完整信息,而存儲下一幀圖像與上一幀圖像之間的差異之處。兩幅圖像中顏色一樣的部分全部跳過。

分析語恰恰就具有這樣的效果。舉個簡單的例子。一個人在用漢語談論昨天發生的事情時,只需要一開始提及「下面這些事情都發生在昨天」,後面就再也不必提及時態了。而英文,則需要反覆使用時態來表明這事情發生在過去。這無疑是巨大的冗餘。毫無存在的必要。所以,學習漢語時,我們從來不會頭疼什麼「過去將來完成進行時」(Would have been doing)這麼見鬼的東西。漢語直接用幾個詞和邏輯關係就說明了情況。

這就是信息的壓縮。這一特點使得漢語的存儲更有效率。

有的人認為分析語劣於綜合語,他們是這樣說的「綜合語只用幾個字母組成一個詞綴就能表示一個特定含義,而漢語做不到」,這就比如說英語中名次尾部加s表複數。這種說法其實就是忽略了分析語的真正優勢到底在哪裡。

分析語中各個詞、乃至各個句子都是有機整體。如果前文說過,今天來的人有三個。那麼後面還何必要提今天來的人是單數還是複數呢?分析語擠掉了語言中的冗餘成分。而在單個詞、單個句子中,沒有多少東西會是冗餘的。因此,拿出單個詞、單個句子來說分析語表意效率低或者有歧義,這本身就是很可笑的。在現實生活中,孤立的詞和句子永遠是少數中的少數。放在更廣闊的背景下,漢語作為一個分析語,其存儲、傳遞效率要比綜合語高,這是不言而喻的。

漢語的這一優勢在古代更顯重要。因為古代最稀缺的是記錄空間,最早人們用石碑、石板,然後用竹片、木片,最後用紙。記錄空間總是很稀缺。所以就需要在狹小的空間里容納更多的信息。表音文字在這方面就比較不利。要麼就只能寫較短的內容,要麼,就要做書寫上的妥協。比如最古老的希伯來聖經里,就不寫任何母音。中國古代史學的發達,是建立在大量的文字記錄的基礎上的。而漢字的存儲優勢,對中國古代史學的發達也有相當重要的作用。

更高的讀取效率、更安全的閱讀能力

漢字由於割裂了文字與讀音,實際上帶來了一個新的優勢。

這是所有表音文字都不具備的。表 音文字讀取的時候,其本質是把看到的圖像轉化為聲音,然後把聲音轉化為含義。當然讀過太多的詞也可以直接轉化為含義,但是這是少數,不影響基本結論。而漢 字讀取時是直接把圖像轉化為含義。你會注意到你快速閱讀中文文獻的時候,是不會注意文字的讀音的,而是直接領悟了文字的意思。表音文字就很少有這種情況。

由於我們在讀取中文的時候可以直接跳過大腦中的一個流程,這使得讀取速度大為加快,而一個次要作用則是使得語言功能更加安全。也就是說,即便大腦中語音轉換系統完全失靈,對我們的閱讀能力影響也不大。因此,中國人得「失讀症」的概率是較低的。

所謂失讀症是說一個人喪失了語言能力,面對文字,已經無法閱讀。母語為表音文字的人患失讀症的概率比中國人高得多。因為中國人患失讀症的原因是大腦中的圖像轉換系統出現了問題。而表音文字使用者如果圖像轉換系統或者語音轉換系統之中有一個出了問題,就會得失讀症。

美國人之中約有10%到20%(依標準不同)患有程度不等的失讀症,而中國失讀症患者則極為罕見。這也是中文閱讀上的一個優勢。

另外,漢字實際上是一種二維編碼體系,而表音文字是一種一維編碼體系。這使因為聲音本身是一維的,只能沿時間軸延伸。而漢字能夠在平面上沿豎直和水平兩個方 向延伸,所以一個漢字往往就能代表很複雜的意思。由於圖像本身就是二維的,漢字在更加充分地利用了人類的視覺系統,因此讀取也就更加快速。

因此,作為一個存儲規格而言,漢字是非常優秀的。當然有人詬病說漢字的書寫速度不高。但從一個漢字來說也許是這樣。但是與英文一樣,漢字也有連筆字,而且漢 語的存儲效率比較高,也彌補了這方面的弱點。更關鍵地,對於文字來說,讀取效率比書寫效率要重要得多。

這個道理其實很簡單,在網路裡面也適用。大家注意到現在的很多網路中,下載的極限速度要高於上傳極限速度,而且一般都是高好幾倍。這是因為下載數據量總是比上傳高得多。

同樣,現代社會裡,一個文字記錄,被讀取的次數一般都比書寫次數多得多。更不要提大規模印刷之後,絕大多數我們看到的文字都不需要有人實際去書寫。所以對於一個現代語言來說,讀取速度也就比書寫速度重要得多。

漢字:偉大的基礎

漢字為漢語成為世界最先進的語言提供了必要的基礎。

漢語一開始也是一種綜合語。大量使用詞根、詞綴。但是從文字角度,漢字為漢語成為分析語提供了非常關鍵的基礎結構。漢字天然不利於詞形變化。因此,詞形變化往往只能採用,在詞/字後面增加一個漢字來表示。而這個增加的漢字就變成了一個通用規則。這個規則確立之後就與修飾的特定詞失去了必然關係。這個變化不再視為詞形變化,而被視為詞與詞之間的邏輯關係。比方說,中文規則里,「了」表完成。有學者認為,這是一個古老的詞形變化演變出的規則。「吃/吃了」、「睡 /睡了」,「打/打了」,規則十分簡單,我們學到的不是「了」變化了「吃/睡/打」,而是「了」單獨表示的一個邏輯關係。這就不像 「Eat/Ate」、 「Sleep/Slept」、 「Fight/Fought」那麼複雜。

而正是由於漢字將讀音與書寫割裂,漢語的以不斷變化,拋棄了輕音,加入了聲調,拋棄了效率低下的聲調,合併了相近的聲調,最終形成今天的現代漢語。我們可以想像,未來漢語還會繼續發展。而漢字與讀音的割裂,使得在漢語語音在幾千年中變化了如此之大,而我們的文化卻沒有多少割裂。

更進一步地,由於漢字並不受限於讀音,因此可以創造出同音異形字,進一步擴展了漢語在發音數量多的優勢。使得漢語能夠更完全的利用單音節和雙音節詞的資源。比方說,因為讀音與文字的割裂,我們可以同時擁有「攻擊」和「公雞」,兩個發音完全一樣但是含義毫無關係的常用雙音節詞。大量使用同音異形詞,這在表音語言里是難以實現的。(當然英文里也有諸如See和Sea,但這實在是很少。)

而之所以我們可以在口語中流暢運用大量的同音異形詞,是因為我們的語言是一種分析語。分析語使得一個詞的意思不僅僅基於詞的組成部分,而同時基於這個詞與其他詞的邏輯關係。有時候甚至是基於與其他句子的邏輯關係。

如果常做翻譯,就會發現,我們一般可以用較短的篇幅表達英文較長篇幅才能表達的意思。這就是效率高的體現。如果讀出來,那效率就更高了。

所以我們的文字、我們的語音以及我們整個語言整體,都是有機結合在一起的。推崇漢字的拼音化或拉丁語話,都是沒有看清這種密切聯繫。因此盲目把文字拼音化的韓國就會出那種把防水材料搞成吸水材料的笑話(韓語里「防水」和「放水」讀音一致,結果建築公司錯誤理解了圖紙)。

不夠嚴謹?

有人說漢語的劣勢就是不夠嚴謹。

這其實可以說是分析語和綜合語的差異。分析語對於詞的具體含義需要通過上下文確定。如果上下文給予信息不足,就有可能出現歧義。而很多時候,上下文只能表明這個詞更可能是什麼意思,而不能完全否定其他理解。 這雖然在交流中不會有什麼問題,但是在那些防止別人鑽空子的文件里就可能造成問題。

我們舉個例子:「中國絕不會首先使用核武器。」

這句話中,中國的態度,用大白話講,就是中國與某國的戰爭中,中國不會在對方沒有對中國使用核武器的情況下對該國使用核武器。但是上文同樣可以理解為「中國與某國的戰爭中,中國不會在還沒有對該國使用常規武器的情況下就對該國使用核武器」。誰都知道那句話其實是第一種理解,但讀者並無法用那些文字來否認第二種理解。

因此,很多人認為漢語的這種不嚴謹性會妨礙法律條文和合同。

但是,我們可以看出,漢語要想說的嚴謹,也是沒有問題,只不過要比一般多一些口舌而已。分析語本身的表意效率就很高。多花一些筆墨,達到嚴謹的效果,也是完全可以做到的。只不過要多花一些心思罷了。

劣勢:難以學習

毋庸置疑,雖然漢字承載著漢語的諸多優勢,但是漢字本身最大的劣勢卻是不可迴避的。那就是不利於學習。

我在背英語單詞的時候,發現最好的記憶方法是把意思和讀音結合起來,然後通過讀音記憶拼寫。(完美的表音文字,應該是讀音與拼寫的直接對應。英語由於受到其他語言影響太多所以這方面相對較差,不過這種規律還是相通的。)

相對與文字,人對讀音的記憶速度更快。而表音文字,一旦掌握了拼寫和讀音之間的規律,就很容易記住文字。

而漢語在這方面是很差的。字和字之間缺乏聯繫,字和讀音之間很少有聯繫,而且由於幾千年語音的變化,經常看著是個形聲字,讀音卻與想像的相差甚遠。這是我們文字的劣勢。但是這是中文讀取速度快所帶來的代價。

我們可以看到,幾千年來文字的發展歷程。它總是首先於兩個因素:表意的需要,學習和書寫的難度。

一開始我們的老祖宗試圖用一個字代表一個特定含義。這是很自然的思路。但是後來隨著需要表達的意思成幾何級數增長。漢字逐漸就不夠用了。或者說,這樣的話,同音字實在太多,不利於傳播了。於是多個字組成的詞才出現。在此之後,一大批原來造出來的字都被拋棄了。

比方說騅、驪、騍這種專門為表示特定種類的馬的字。還有璇、璣等等一大堆帶王字旁(斜玉旁)表示特定種類的玉器的字。後者畢竟意思還不錯,還在名字里用一用。

有一些人對漢字的簡化持有非常大的非議。我覺得大可不必。漢字的簡化是必要的。越複雜的字形,越難以學習。漢字幾千年的發展,使得字形與含義的距離也越來越遠。複雜的字形在表音、表意方面並無優勢。進與進、從與從、後與後,都沒看出來繁體字在表意方面有何優勢,而簡體在學習的簡便性上優勢倒是很明顯。每次看到「憂鬱的烏龜」,我自己都快憂鬱了。

當然,漢字簡化還將一些意思完全不同的字合成了一個字。有個著名的繁體字愛好者嘲笑簡體字的段子是「我女朋友下面給我吃」有歧義。而繁體字版,因為能區分面和麪,是沒有歧義的。

但是,拜託,我們是分析語好嗎?拜託有一點分析語的自覺好不好?你覺得專門找一段孤立的話,有什麼價值么?如果找個綜合語,能用詞形變化把「(男性)我」和 「(女性)我」分開,更可以輕易嘲笑漢語造成歧義。分析語本身就要求有上下文提供必要的信息,因為分析語藉助邏輯關係省略了大量的信息才實現了更高效率的信息傳遞。這點小小的歧義在現實生活中是不會造成什麼影響。你要問為什麼,這很簡單,因為漢字簡化都不是幾十年前那些人坐在那裡拍腦袋寫出來的,而是之前至少上百年就有人大規模使用的。如果頻繁造成歧義,早就沒有人那樣用了。

當語法發展完全,使用充分之後,維持龐大而複雜的常用文字型檔只能不利於學習。適當的簡化是必要的。漢字本身的優越性並不高,但是它為漢語的優越性提供了必要的基礎支持。沒有漢字就沒有漢語,但是漢字本身也是需要時不時進行改革的。畢竟學習的難度在目前條件下還是顯著高於其他語言。如果能在不傷害對漢語的支撐能力的情況下使得漢字更好學習,這無疑是一件好事。

四、後記

實際上我寫這篇文章的目的並不是想讓大家確信漢語就是世界上無可匹敵的最優秀的語言。語言的用處有很多種,不同的語言在不同的方面各有優劣。比如說,表音文字因為採用了非常小的字符集,因此在計算機輸入中比較簡單。而且大家也可以看出本文論證並不十分嚴謹,實際上就是聊備一說。不必過於認真。

我寫這篇文章的目的,只是希望讀者能夠在閱讀本文之後拋棄妄自菲薄的看法,我希望不要有人再覺得漢語是一種落後的語言。

========================================

其他網友看法:

1、以儘可能少的發音部位來發聲,這是現代漢語的優點。某些語言,恨不得開個口腔雜技團,所有能主動發音的部位,不能主動發音的部位都來摻乎,蠢得要死。

2、漢語犧牲發音的非歧義性而保表意的高效性, 這一點我很欣賞,一個很好的例子就是 生物 醫學 化學中的術語。英文的術語實在是太過陽春白雪 甚至是複雜得無厘頭, 而中文的術語則相當於為讀者進行了很多的梳理和提示。

我多次想看生化方面的一些英文科普書作為消遣,結果被術語高的沒興緻了。

還好在數學物理方面 英文的術語基本都是借用日常用語或用人名命名。

這是因為英語有一種自卑情結,一說到「專業」術語,常常要用拉丁語,否則就覺得不夠專業。

你說,split personality多麼好理解,非要搞一個Schizophrenia,其實也不過是用拉丁語說「人格分裂」。

3、原來漢語和拼音文字的最大區別是印刷成本。漢語有5000多個單字,任何一個小報社,小出版社要印東西最起碼要準備好幾百萬個甚至上千萬個字碼,要不然就要臨時刻字。而拼音文字就是幾十個字母,相對而言漢字印刷費時,費工,費料,印刷成本比拼音文字高指數量級。其實在我的小時候,tg真的要準備把漢字拼音化,步日本,韓國,朝鮮,越南的後塵。沒辦法,國家本來就窮,印刷成本又高,社會負擔太大。

然後就是計算機救漢字。這裡面有幾個關鍵產品:

第一個是UCdos,計算機可以漢化,這使得土共看到了中文進入計算機世界的希望。

第二個是四通利方的漢字打字機,這是第一種可以打漢字的打字機。在此之前漢字完全不可能列印,只能手寫。

第三個是清華紫光的出版系統,這個使得漢字在出版上可以和拼音文字平起平坐了。

第四個是五筆字型,這個使得漢字的輸入速度可以超過拼音文字。現在速記員不需要記速記符號了,全部靠電腦打。

其實文字的主要用途就是記錄和傳播。在八十年代信息的傳播趨勢明顯是計算機,網路。在沒有計算機的漢字技術之前,漢字出版效率低,對計算機完全隔絕,網路完全進不去,那時的tg真的急呀。咱小時候看過的科普片里拼音文字絕對是下世紀的未來文字。漢字雖然在記錄,理解上有優勢,大概比拼音文字好個幾倍,但是在傳播上劣勢太大,是拼音文字的傳播能力的幾十分之一,甚至是幾百分之一。

但是計算機技術改變了這一切,徹底扭轉了漢字的傳播劣勢。現在比拼音文字的傳播上是各有千秋,甚至以咱理解還是稍稍領先。現在可以發掘漢字的合理之處了。

漢字用5000個字解決了絕大多數人面對絕大多數文章的理解問題,就憑這一點漢字就已經領先拼音文字很多了。拼音文字要達到同樣效果至少需要十萬單詞量,要一個人學10年以上。

4、計算機進入中國的初期對漢字的衝擊那是相當大。

在還沒有解決上述提到的1-4的編碼方式、表達、輸入等的情況下,很多人(包括一些名人和文化界大人物)受對計算機技術的了解有限、西人的誘導等等,漢語拼音化言論鋪天蓋地、甚囂塵上。

是那些有骨氣的、堅信漢語的優越性、中國文明在計算機世界一定能找到自己的出路的人的堅持與創新才有了今天。

在這裡特向以王永民、王選等為代表的他們致敬。

5、老式打字機中,漢字打一個字只要一鍵,而英文打一個詞則平均要6鍵(包括打一個空格)。漢字打詞的話就是二鍵:2:6和30:120,輸入效率的差別不是太大.

6、說到單字的信息量,還是我們的古文最強!騮,驊,騅,一個字就可以省略很多關於馬毛的形容詞。小時候讀聊齋,翻成白話文後,篇幅長了幾倍,味道卻淡了很多。

7、公司亞太區法律部的領導,一個美國人,思路清晰邏輯性很好、而且反應也很快,在這個公司算是很少見的聰明了——這個要求是不是太低了?以前我也這麼覺得,但現在發現一個具有不錯的邏輯思維能力的in house legal counsel,至少在亞太這樣的地方,大多數從業者都不夠格,大概主要靠語言在混吧。

不管怎麼說,我很喜歡這位領導,溝通起來簡單,有時候也能學到一些東西。

前幾天有個合同,他跟我都審了一把;因為他是領導,我先了解他的意見,發現雖然他思路還是很清楚、但很明顯有很多細節他沒看到(有些問題在合同里已經有了回答,而有些問題因為合同里其他條款要做更深的討論)。當然,跟他一溝通這些問題就都解決了。

以前我一直有個感覺,就是中文閱讀要比英文閱讀快,當時主要解釋是畢竟中文是母語那麼讀起來肯定快;但結合這個事情想想可能不完全是這麼回事,有可能是,英文的詞語都是字母組成的、當它構成句子和段落後要理解含義就要消耗更多的時間和精力來「看清楚」,而中文單字的視覺衝擊更強烈、組合成型且習慣閱讀後只需要較少的時間精力就能攝取其涵義,特別是英文里有不少詞只要非常小的變形(比如加個兩字母的前綴)就能變成完全相反的意思、而在中文裡要麼是另外一個詞要麼會有比較強烈的否定單字,不需要很複雜的確認過程。

總體上就像樓主說的中文更多的是視覺信息、英文是聽覺信息,而好像做過統計人類80%的信息都是通過眼睛獲取的,考慮到眼睛的攝取方向有限而耳朵是360度,可知眼睛的攝取能力要比耳朵強太多了。也許跟這個有關?

8、漢語的音調應該可以視為調頻技術吧!通過頻率變化,增加單位時間內的信息承載量。

========================================

黑傳說的看法:

這世界就是那些堅信的人可以找到出路的人的堅持和創新,才有了今天!!!


推薦閱讀:

「三大機制」推動活動成常態(創先爭優先進典型)
蘇-35先進座艙幾乎看不到儀錶
《論語講義》——先進第十一(2)
魚與熊掌兼得的藝術:三代先進高強鋼
【薩沙講史堂第三百四十八期】越南會購買這種先進戰機?它號稱可以同第5代戰機對抗(軍事系列第165講)...

TAG:語言 | 漢語 | 世界 | 先進 |