如何看待古西夏文編入unicode?

01-15

這只是Unicode發展中的其中一步。

聽魏安說過，西夏文（嚴格來說，Unicode涉及的只是對書寫符號進行編碼，而非文字，下面就改回以西夏字稱說）從計划到最後真正進入Unicode碼錶的時間將近有八年（希望我沒記錯），參與其間的人也不少，有好幾個國家的，直到最終定稿前都還略有增補。來源的文獻碼錶中已有明確說明，多說無益。

和西夏字有關的區塊碼錶如下：

Tangut http://www.unicode.org/charts/PDF/U17000.pdf

Tangut Components http://www.unicode.org/charts/PDF/U18800.pdf

Ideographic Symbols and Punctuation http://www.unicode.org/charts/PDF/U16FE0.pdf （這個區塊之後還會添加和女書有關的字元。）

但這個進程並不會因為西夏字區塊的定稿就結束了。在定稿之後，有位朋友（時間有點久了，記不清是哪位，印象中那人不是中國人）和魏安說，還有很多異體的西夏字無法處理。魏安在今年年中的會上提交了一份用SVS的辦法來處理異體字的提案，但也不是那麼快就能通過的。當時會上的看法似乎更傾向於用IVD來解決而非SVS。如果以後還發現新的西夏字，再增補一個區塊也沒什麼不可能。

西夏字異體處理的提案如下：

L2/16-111 WG2 N4722 Preliminary proposal to define 357 variation sequences for Tangut ideographs http://www.unicode.org/L2/L2016/16111-n4722-tangut-var-seq.pdf

諸多西夏字重要的研究資源中仍有很多漢字缺字，需要陸續增補，有興趣的朋友可以期待一下Ext G和H。

西夏字之後還會有更多其他中國古文字要進入Unicode，這些不過都是其中一個進程罷了，沒必要過度解讀。今年九月剛在銀川開了契丹大字編碼的會議，契丹小字的編碼也基本成型了，中國代表最近提交了水書最新整理的字元，比之前略有增刪，趙麗明教授還提交了納木依字、木雅字、爾蘇沙巴字、普米字、摩梭字、汝可字、他留字等西南民族古文字的編碼請求……

大概就醬……

寫完這答案，發覺可能有些朋友不知道我在說什麼。已經盡量附上碼錶和提案的鏈接了，想了解的，點進去看就可以了，原初的提案太多，就不一一上鏈接了。

牆裂支持啊！這樣大家就可以用Unicode的西夏文字體而不是景永時字體、柳常青字體、韓小忙字體、台灣字體等奇奇怪怪的西夏文字體了。不過這個Unicode還有些問題，比如有些字是錯字，有些字的字形不對等等。我已經把今昔文字鏡的西夏文字體映射到Unicode上了，歡迎使用。http://www.ccamc.co/fonts.php

我個人認為說明了東亞在世界格局中的地位提高了，就連古文字也隨著計算機技術走遍了全球。這和幾十年前，國內外很多人認為漢字無法用電腦處理，必將被淘汰的情況相比，已經發生了巨大的變化。感謝中國經濟的快速發展。

另一方面，我認為我們在文字方面應該更開放一些，也要有相應的國際眼光。在漢字規範化方面，應該和東亞各國合作，共同把漢字發揚光大，盡量保持東亞通用文字的地位。

現在的大部分人用的文字元號已經收錄好了，為何不可以開始現在的少部分或者只是幾個人用的，而它又曾經是一個大的文明的文字的符號呢？

並沒有什麼宗旨或者原則認為，收錄已經滅絕了的文明的文字，是沒有必要的。

所以私以為，如何看待這個事件，這是「發展的必然結果」，如是而已。

這無礙現在的大多數人的日常生產生活。