八輔音義補全計劃(一)?字體篇

如果要充分討論八輔字和 Unicode 之間的聯繫,我們可以從 2002 年談起。

在此之前的 1999 年,激動人心的康字序超中日韓九版(SuperCJK Version 9.0 Ordered by Kangxi Dictionary)剛剛發布,可把這些 NB(National Body)給 NB 壞了,各源再接再厲,一口氣?了六萬五千多字,震驚了特別小組(ad-hoc group)。特別小組親切地表示:

... f ... u ... c ... k.

—— IRG N830

在無視特別小組委婉的抗議之後,各源刪減提交的字形再度提交,經整理得到了 26077 字,這也是後來的擴展 C1 區。其中 G 源(中國大陸源)此次提交了 7643 字,我們不難發現,大量的八輔外字赫然出現於列表內。這些八輔外字均以「CYY」開頭,「CYY」即「測研院」,aka 中國測繪科學研究院。

IRG N891 - CJK Extension C1 From China, P1.

此後又發生了一系列事情,which 足夠用來寫一本《IRG 的黑歷史》,這些字中被賦予 Unicode 碼位的也屈指可數。我們本以為這些進入 Unicode 的字們應有充分的證據,但事實告訴我們:

IRG N1227 - Evidences for CJK_C1 characters (from China), P436.

湖 南 省

這也叫字證?

EXO ME?

後話是,這地名現在改成了「黃泥澡」,在湖南省長沙市瀏陽市古港鎮高聯村。


我們知道,「國家基礎地理信息系統 1 : 5 萬地名資料庫」是基於第一次全國地名普查而完成的。第一次全國地名普查不但為我們帶來了詳細的地圖和卡片資料,各省市縣也基於此編纂了當地的地名志。

基於此, @王謝楊 的《八輔字情調查參考資料(不定期更新)》一文得以寫成並不斷成長。

在整理參考資料的過程中,我們不僅給八輔內的相當一部分字找到了證據,還發現了一些並不在八輔範圍內的 Unicode 外字。至此,「讓這些漢字進入計算機」成為了企劃的主旨。「八輔」僅是一個代號,代指所有還未被賦予編碼的地名用字,每一個漢字都代表著一群人的不方便和暫時的屈服妥協。

但我們並不願意屈服。脫 P 入 U 的偉大使命召喚著我們。


那麼如何讓這些漢字進入計算機呢。

十分概括地說,文字呈現於顯示屏就是讓用鍵盤輸入的「字母」變成「數字」,最後變成「圖像」。將「字母」變成「數字」的玩意叫做「輸入法」,將「數字」變成「圖像」的玩意叫做「字體」。

輸入法我們打算讓 @Sim-CH 來做。我們來談談字體。

咱的字體首先需要滿足一些需求,比如給大家用的字體,比如給 @王謝楊 用來做字情調查表的字體,比如給我用來做八輔破字典的字體。

給大家用的字體需要保證用戶群體足夠大,於是我們和 @Sim-CH 的字型檔聯動。

然後是這些字擱哪。這涉及到碼位的問題,我們經過胡亂論證,閉著眼睛審批,最終決定 @Sim-CH 擱哪咱就擱哪。於是這堆外字就被放在了私用增補 B 區,哪天誰有正式碼位了我們再把它弄到 Unicode 規定的位置上去。

最後是這些字長啥樣。我們想起了 G 源。

當八輔字最早在擴展 C1 區提交的時候 G 源提供的還是圖片,等到這堆字被推遲到擴展 D 區的時候 G 源得提供字體了。既然 G 源已經為我們做好了一部分字體,我們為何不藉此將其加以擴展完善呢。

如此三個問題一旦解決,剩下的臟活累活便可交給時間。徐志摩說得好:「時間時間會給我答案」。

最後,包含全部的「U 內八輔內字 + 有來源的 U 外八輔內字 + 有來源的 U 外八輔外字」的字體便完成了。

此處為下載鏈接,密碼為 8wr9。其中字彙破宋為我用來做八輔字典所用的破字體,其餘兩個字體為提供給大家進行非商業使用的字體。魯迅說得好:「商用死全家。」這些字體自然僅供顯示八輔字情調查表的部分內容以及進行學術交流。

牟利必究。

【參考資料】

[1] IRG N830 文件。原句為「Most of small number proposers are following the unification rule and not seeing a request beyond current unification framework.

[2] IRG N891 文件。

[3] IRG N1227 文件。

[4] 字海網。


推薦閱讀:

使用這些現代感的字體,助你走在設計的最前沿(附免費下載地址)
sketch插件-FontRapid

TAG:字體 | 地名 | 信息技術信息交換用字符集第八輔助集 |