如何看待古西夏文編入unicode?


這只是Unicode發展中的其中一步。

聽魏安說過,西夏文(嚴格來說,Unicode涉及的只是對書寫符號進行編碼,而非文字,下面就改回以西夏字稱說)從計划到最後真正進入Unicode碼錶的時間將近有八年(希望我沒記錯),參與其間的人也不少,有好幾個國家的,直到最終定稿前都還略有增補。來源的文獻碼錶中已有明確說明,多說無益。

和西夏字有關的區塊碼錶如下:

Tangut http://www.unicode.org/charts/PDF/U17000.pdf

Tangut Components http://www.unicode.org/charts/PDF/U18800.pdf

Ideographic Symbols and Punctuation http://www.unicode.org/charts/PDF/U16FE0.pdf (這個區塊之後還會添加和女書有關的字元。)

但這個進程並不會因為西夏字區塊的定稿就結束了。在定稿之後,有位朋友(時間有點久了,記不清是哪位,印象中那人不是中國人)和魏安說,還有很多異體的西夏字無法處理。魏安在今年年中的會上提交了一份用SVS的辦法來處理異體字的提案,但也不是那麼快就能通過的。當時會上的看法似乎更傾向於用IVD來解決而非SVS。如果以後還發現新的西夏字,再增補一個區塊也沒什麼不可能。

西夏字異體處理的提案如下:

L2/16-111 WG2 N4722 Preliminary proposal to define 357 variation sequences for Tangut ideographs http://www.unicode.org/L2/L2016/16111-n4722-tangut-var-seq.pdf

諸多西夏字重要的研究資源中仍有很多漢字缺字,需要陸續增補,有興趣的朋友可以期待一下Ext G和H。

西夏字之後還會有更多其他中國古文字要進入Unicode,這些不過都是其中一個進程罷了,沒必要過度解讀。今年九月剛在銀川開了契丹大字編碼的會議,契丹小字的編碼也基本成型了,中國代表最近提交了水書最新整理的字元,比之前略有增刪,趙麗明教授還提交了納木依字、木雅字、爾蘇沙巴字、普米字、摩梭字、汝可字、他留字等西南民族古文字的編碼請求……

大概就醬……

寫完這答案,發覺可能有些朋友不知道我在說什麼。已經盡量附上碼錶和提案的鏈接了,想了解的,點進去看就可以了,原初的提案太多,就不一一上鏈接了。


牆裂支持啊!這樣大家就可以用Unicode的西夏文字體而不是景永時字體、柳常青字體、韓小忙字體、台灣字體等奇奇怪怪的西夏文字體了。不過這個Unicode還有些問題,比如有些字是錯字,有些字的字形不對等等。我已經把今昔文字鏡的西夏文字體映射到Unicode上了,歡迎使用。http://www.ccamc.co/fonts.php


我個人認為說明了東亞在世界格局中的地位提高了,就連古文字也隨著計算機技術走遍了全球。這和幾十年前,國內外很多人認為漢字無法用電腦處理,必將被淘汰的情況相比,已經發生了巨大的變化。感謝中國經濟的快速發展。

另一方面,我認為我們在文字方面應該更開放一些,也要有相應的國際眼光。在漢字規範化方面,應該和東亞各國合作,共同把漢字發揚光大,盡量保持東亞通用文字的地位。


現在的大部分人用的文字元號已經收錄好了,為何不可以開始現在的少部分或者只是幾個人用的,而它又曾經是一個大的文明的文字的符號呢?

並沒有什麼宗旨或者原則認為,收錄已經滅絕了的文明的文字,是沒有必要的。

所以私以為,如何看待這個事件,這是「發展的必然結果」,如是而已。

這無礙現在的大多數人的日常生產生活。


推薦閱讀:

能用蘋果式中文寫什麼搞笑的東西?
你心目中的 2017 年度漢字是什麼?為什麼?
為何??二字看起來這麼奇怪??
無法忍受錯別字,這是病嗎?

TAG:語言 | Unicode統一碼 | 文字 | 西夏文 | 党項語西夏語 |