IRG中被遺忘的馬來西亞源和新加坡源(未竟)

和 @蘇素念 有了次「歷史性」的會面後,再一次感覺Unicode在東南亞(尤其是中南半島)是可以大有作為的,有無數個坑值得去填補,也應當被填補。但在去做那部分事情之前,東南亞的漢字也應當被重視起來。

對於熟悉Unicode,尤其是CJKV表意文字部分的朋友來說,越南源(V源)的存在是無法被忽視的。因為某些原因,越南缺席了Ext F和Ext G的提交(Ext D作為收錄UNC的區塊,越南自己提出撤銷)。今年7月的某天,我和VNPF的Lee Collins有了一次談話,談話內容不重要,重要的是越南(Vi?t Nam NB)會在WS2017(aka Ext H)中再度提交喃字/岱喃字。就在寫此文的不久前, @趙瑾昀 無意間發現了一個對於越南來說很重要的字,而且這個字的同形字在紹興戲中有用例(經 @王謝楊 查證,魯迅寫到這個戲時已經沒有使用那個字),日本曾作為Hanyo Denshi的一部分提交過給IRG(表意文字小組),但最終並沒有進碼錶。這個「神奇」的字該如何處理,我們還需要更充分的證據和更可行的考慮。

然而在IRG活動過的東南亞國家除了越南,其實還有馬來西亞和新加坡。在Ext A中有一個GS源,是放在G源(中國)名下的新加坡字,但後來,新加坡是有自己活動過的,但所提交的字不多。馬來西亞也是活動過一段時間,曾計劃舉辦IRG的會議,但由於不清楚的原因,連會議都撤銷了。從當時的提案內容來看,馬來西亞提交的字是確實是他們很需要,而且整個委員會陣容龐大,但他們對IRG的活動要求似乎並不熟悉。最後這兩個源一個字都沒進去。馬來西亞被寫進了PnP,即使看不到他們的參考來源,但也能知道他們來過,新加坡便完全沒這個待遇了。

以下是我從IRGN899、IRGN1418、IRGN1549和IRGN1552中梳理出來的當時這兩個源所提交漢字的命運。

一、未編碼部分

馬來西亞

?舟冬 ~舡 tongkang的音譯 IRGN1418 *缺少來源參考。

?訁丕 ~話 潮州話,談話 MCLC-1 IRGN1485 or ML-00001 IRGN1549/IRGN1552 *國內的潮汕話書籍不用這個字。

?訁旦 潮州話,說 MCLC-2 IRGN1485 or ML-00002 IRGN1549/IRGN1552 *國內的潮汕話書籍不用這個字。

新加坡

??來攵心 S0-212C IRGN899 =憗

?釒匡 S0-2446 IRGN899 =??

?車太 RW1303 IRGN899 =軚

?魚孟 RW9082 IRGN899 =鯭

?春鳥 RW9246 IRGN899 =??

如果各位認識馬來西亞和新加坡的朋友,能找到這8個字在當地的實際用例,我很希望能將他們編碼。

二、待編碼部分(WS2015 = Ext G)

馬來西亞

?氵閃 閩南方言,客家方言,長度單位 UTC-01784/UK(漢大二)

新加坡

?釒光 RW1421 IRGN899 UTC-02218/UK(漢大二) =銧

?疒積 RW1247 IRGN899 UTC-02664/UK(中華字海) =癪

?釒厄 RW9109 IRGN899 UTC-02678/UK(中華字海) =鈪

?釒吉 RW1488 IRGN899 UTC-02680/UK(中華字海) =銡

這部分字其實算比較常見的,?釒厄是粵方言用字,在廣東多見。英國在WS2015中採用《漢大二》和《中華字海》提交了大量的類推簡化字,。

三、已編碼部分

馬來西亞

?蟲尋 ?? U+2B2BB (GCH-2014.82) IRGN1418

新加坡

?石達 ? U+9FCE (GFC-022) S0-2250 IRGN899

?巾賁 ?? U+2AA78 (GCH-2004.50) S0-223D IRGN899

?糹今 ?? U+2B11B (GCH-4011.54) RW0875 IRGN899

?釒宗 ?? U+2B4FD (GBK-1021.02) RW9272 IRGN899

?蟲喬 ?? U+2B2B8 (GCH-2014.79) RW1407 IRGN899

?蟲尋 ?? U+2B2BB (GCH-2014.82) RW9232 IRGN899

?車翏 ?? U+2B416 (GCH-4018.68) RW0804 IRGN899

?面貴 ?? U+2B583 (GCH-3022.58) S0-2422 IRGN899

?韋?? ?? U+2B594 (GCH-4022.97) S0-243F IRGN899

?兆頁 ?? U+2B5AF (GXC-5023.25) RW9209 IRGN899

?飠胡 ?? U+2B5EB (GXC-3024.06) RW9235 IRGN899

?馬匋 ?? U+2B626 (GCH-5024.96) RW1425 IRGN899

?魚曹 ?? U+2B6A7 (GCH-1027.09) RW9084 IRGN899

?魚巤 ?? U+2B6AD (GCH-4027.31) RW9086 IRGN899

?魚章 ?? U+2B812 (GZH-1716.17) RW9085 IRGN899

?馬余 ?? U+2CCFF (GCH-3024.86) RW1424 IRGN899

已編碼的部分全部來自中國的提交,出處都是中國常見的幾部大型辭書。

雖然新加坡和馬來西亞似乎已不太會在IRG再有活動,但如果當年提交的字確實能反應他們的實際使用漢字情況的話,或許給予橫向擴展是有必要的。

來源參考可以包括以下:

馬來西亞部分:

*MCLC

*MYN1418:IRGN1418提交時候沒有給出來源參考信息,如果要拿他們來做橫向擴展,採用西夏文後來的辦法來解決。如:?舟冬為*MYN1418-1,其餘類推。

新加坡部分:

*S0

*RW:可能更改為*SRW會比較合適。

當然除了馬來西亞和新加坡,還有很多華人地區會有未編碼漢字的情況,這些對我們來說也是可以大有作為的。歡迎各位對東南亞情況的知情者砸字給我。


推薦閱讀:

在大馬講華語,沒你想的那麼容易 | 針尖多味聽覺館
出國第一站應該去哪裡玩最合適?
肉骨茶里沒有茶?這道馬來西亞老少皆宜的美食竟源自百年前的中國。
吃遍全球—馬來西亞不可錯過的美味伴手禮

TAG:Unicode统一码 | 汉字 | 马来西亚 |