假如漢字像瑪雅文字一樣在16世紀失傳了,現代是否能破解?其難度有多大?

這裡的「失傳」指語言和文字同時不再被使用,僅留書籍、碑刻,等等文字資料。

假設日韓越放棄漢字表記,改用字母。現代無人能識別漢字。但此三國有關漢字的文字資料仍存世。

另外,16世紀漢字已很成熟,突然消亡,而考古中又發現了甲骨文金文等更為古老的文字,研究者能夠斷定甲骨文金文與 16 世紀漢字有傳承關係么?還是會誤認甲骨文金文為另一種古代語言的表記?書法中字體的巨大差別又對解讀會造成什麼困難呢?小篆和楷書會被認為是不同語言的文字嗎?


作為完全的非專業人士來猜想一下:

首先,16世紀的時候已經有很多外文經典被翻譯成中文了。敦煌的佛經中就有藏文、梵文、回鶻文和漢文的版本,應該有助於破譯。另一個突破口是天文曆法和算學方面的書籍(有大量的數詞、口訣,容易找到規律)以及有插畫的書籍和小說(能夠看圖猜文)。研究明代文人畫中題字、題詩的方法也能夠幫助破譯。然而,中文的句法和大量的通假字、異體字應該會增加破譯的難度。此外,白話文和文言文、詩詞的區別可能會讓研究者將其分為三個系統。同樣地,篆書、隸書、楷書、行書和草書可能也會被分為不同的系統來研究,要看出各種書體的對應關係也很有難度。最後,中文的書籍實在太多,要讓研究者從如此大量的書籍中找到易於突破的文本也是很困難的。

另:如果漢字能夠撐到1607年再失傳,就能多出幾個突破口:利瑪竇的《幾何原本》、《坤輿萬國全圖》等資料;如果能撐到1644年再失傳,就能多出《天工開物》、《徐霞客遊記》、《農政全書》、《演算法統宗》修訂版以及《崇禎曆書》(介紹了第谷、哥白尼的天文學和幾何學理論)等圖文並茂,容易破解的典籍。十六世紀末到十七世紀初期是中國科技全面總結起步的時期。


十六世紀大致是明朝晚期了。

而明朝的話,《華夷譯語》都出來不知道多少本了,直接翻譯就是。比如這是其中一冊,翻譯成波斯語的:

那麼考慮上面這一本漢-波斯語的詞典流傳到了歐洲,那麼接下來發生的事情是:

  1. 這本書中出現了兩種不同的文字,因此可能是字典
  2. 每個條目中頂上的字是阿拉伯文,可能是阿拉伯語或者波斯語。經過辨認是波斯語
  3. 條目中間和底下的字應該就是漢語。底下的小字使用的符號很少,很可能是用來表音。而經過和波斯語學者聯手比對的話,估計能確定擬音小字是波斯語的音標,估計還能定出的字母表
  4. 中間的大字幾乎沒有重複,考慮到這本書的詞典屬性,它應該就是漢語的詞了,於是我們可以「解」出漢語——但是讀不出來,因為沒有韻書。


如果只是孤立地有某一種語言的書籍、石碑,那麼可以推斷出古人使用漢字時候的頻率問題,這裡面當然對理解一個語言可以有幫助,但是「破解」可能仍然算不上。如得到一本詩集,見其中談到「月」等頻率很高,可以很容易找到伴隨著「月」 以高頻率出現的其它常見的漢字、如果發現了詩歌中的對偶性,則還可以統計出與「月」對偶的漢字。但如果一個語言真的滅絕了,那麼我們再來談這些「理解」,是否對我們了解一個語言有幫助呢?這些字究竟是什麼意思仍然很難推斷。即使是象形文字,一個一個猜起來還是很困難的,在對一個語言完全沒有充分理解的情況下,一個一個用「象形」來推斷,這是低效且容易誤入歧途的。沒有文字演變的源流信息,僅憑「象形」,至少比我們現在認甲骨文更困難得多。

那麼怎樣才能真的算破解一個語言呢?

參考羅塞塔石碑的破解方法,Rosetta 碑能夠被破解的原因在於同一塊石碑上刻上了三種語言的內容,因為古希臘文是近代人類可以閱讀的,這對於破解消失的文字可能是非常重要的。

即,如果想要「看懂」,那麼一些對譯的材料會是很重要的,如果我們找到了漢語與某個語言對譯的字典(即使是西夏語這樣的另外一個消失的語言)都顯然會對我們理解漢語提供很多的幫助。如果「字典」不存在,但是存在對譯的一些材料,例如發現了一本中文翻譯的外國小說,或者是找到了國際會議中的文件的不同語言的版本,這在當代已經不再困難了——只可惜題主的限制,那是 16 世紀,這樣的跨文化交流還很有限,因此需要從中篩選出最有價值的對譯材料。有了大量的對譯材料,即使沒有「字典」,即使沒有其它先驗信息,用現在的 IBM Model 也是可以把「字典」用統計的方法推斷出來的。

而題主所說的,「漢字」在 16 世紀就滅絕,這就讓問題變得很困難了,漢字文化圈本身就很大,如果要真正意義上滿足題意,則還需要整個東亞、東南亞日常使用的文字全部都消失,可能能用的「對譯」材料也就變少了許多。不考慮那個方向的一些譯文材料,可以考慮的則是絲綢之路上的一些多語言的碑刻和文獻,這些可能會為為這樣的推斷提供一些線索。

但是這破譯起來依然很低效,如果想要很好地破解,最好是有更完善的「語料庫」。這時候,如果能意識到某些書籍和碑刻其實就是佛經的譯文,在能讀懂梵文的情況下,可以推斷出許多漢字的含義,在完全「中文」消失的情況下,加上題主給出的 16 世紀的限制條件,對很可能廣泛出土的佛經的跨語言解讀這應該是最最容易突破的地方。在跨語種的分析方面有了突破,再做孤立的某一個語言內部的統計、研究詞語出現的頻率和關聯就變得意義非凡了,個人認為這也是解決這個問題的比較有效的方法。

但是即使這樣,這些漢字要怎麼讀就依然還是難推斷的。有限地推斷部分文字的讀法其實並不困難,而如果需要系統地知道幾乎所有漢字的讀音,可能來自韓語諺文、日文假名、越南喃字的諸多信息可以提供特別大的一些幫助,再在配上音韻學的書,把所有字的讀法全部推出來困難也不是太大,但是如果題主的「漢字」全部消失意味著諺文、日文假名、越南喃字也同時消失,那麼推斷會變得很困難。

至於題主之後補充的,關於「甲骨文金文與16世紀漢字傳承關係 」「書法中字體的巨大差別又對解讀會造成什麼困難」等等這一系列問題,與我此前回答裡面關注的地方並不相同,但是總的來說,我認為關鍵在於出土的文物的數量,數量足夠多,則發現的這些傳承關係和聯繫也就可能更多。如果只有很少的出土文物,學者們看到同樣的書寫形式(從上到下、從右到左),還有很多字寫法上的聯繫也很明顯,自然會有人很容易想到這些這些文字之間可能存在某些聯繫。可是,相反的意見同樣會很有道理,例如甲骨文上記錄的內容其實有獨特的「功能」,這就導致很少有用甲骨書寫的內容在其它材料中能找到相似的東西,因此認為是不同的語言也是不無道理的。在缺乏足夠多文獻基礎的情況下,認為不同字體的寫法可能是不同的語言也是很有可能的,一個未受過書法訓練的外國人很難相信草書會與方塊字是同樣的一種文字。但只要文獻的數目增加,情況就會有變化,本來只是認定它們屬於同一種語言或者不同一種語言,這樣的學者應該都會有一些,都可能有很多支持者,都可能有很多證據。在這樣的時候,只有找到足夠多的文獻作為支持,例如用草書和楷書分別書寫的詩、用小篆和隸書分別抄錄的《道德經》、甲骨上的卜辭和流傳的史書的印證、名山上不同的文人用不同的字體所題寫的山名,有了更多的證據,大家會越來越傾向於相信這其實就是同樣的一種文字的不同的寫法。說到底,和前面的問題一樣,我們需要跨越不同「語言」和「時代」,或者在不同的材料上、用不同的字體書寫的同樣的內容,這些不變的東西,會幫助我們建立起語言之間的聯繫。


想了想應該問題不大,首先考古學家破譯古文字本身就有一套方法,比如統計學原理,根據出現頻率猜測是動詞名詞還是介詞數字等等。然後我們還有很多字典,讀音的話問題也不大,我們有很多象形擬聲字作為突破口。而且漢字天然的優勢就是象形,比其他文字還容易猜一些。


推薦閱讀:

怎麼區分漢字的造字結構(六書)?
在文言文中「爲」、「為」二字的用法有何區別?
為什麼現在很多結構複雜的漢字在文字改革期間沒有簡化?
為什麼有的漢字的聲旁不準?

TAG:語言 | 漢字 | 語言文化 | 漢語 | 文字 |