IRG中被遺忘的馬來西亞源和新加坡源(未竟)
和 @蘇素念 有了次「歷史性」的會面後,再一次感覺Unicode在東南亞(尤其是中南半島)是可以大有作為的,有無數個坑值得去填補,也應當被填補。但在去做那部分事情之前,東南亞的漢字也應當被重視起來。
對於熟悉Unicode,尤其是CJKV表意文字部分的朋友來說,越南源(V源)的存在是無法被忽視的。因為某些原因,越南缺席了Ext F和Ext G的提交(Ext D作為收錄UNC的區塊,越南自己提出撤銷)。今年7月的某天,我和VNPF的Lee Collins有了一次談話,談話內容不重要,重要的是越南(Vi?t Nam NB)會在WS2017(aka Ext H)中再度提交喃字/岱喃字。就在寫此文的不久前, @趙瑾昀 無意間發現了一個對於越南來說很重要的字,而且這個字的同形字在紹興戲中有用例(經 @王謝楊 查證,魯迅寫到這個戲時已經沒有使用那個字),日本曾作為Hanyo Denshi的一部分提交過給IRG(表意文字小組),但最終並沒有進碼錶。這個「神奇」的字該如何處理,我們還需要更充分的證據和更可行的考慮。
然而在IRG活動過的東南亞國家除了越南,其實還有馬來西亞和新加坡。在Ext A中有一個GS源,是放在G源(中國)名下的新加坡字,但後來,新加坡是有自己活動過的,但所提交的字不多。馬來西亞也是活動過一段時間,曾計劃舉辦IRG的會議,但由於不清楚的原因,連會議都撤銷了。從當時的提案內容來看,馬來西亞提交的字是確實是他們很需要,而且整個委員會陣容龐大,但他們對IRG的活動要求似乎並不熟悉。最後這兩個源一個字都沒進去。馬來西亞被寫進了PnP,即使看不到他們的參考來源,但也能知道他們來過,新加坡便完全沒這個待遇了。
以下是我從IRGN899、IRGN1418、IRGN1549和IRGN1552中梳理出來的當時這兩個源所提交漢字的命運。
一、未編碼部分
馬來西亞
?舟冬 ~舡 tongkang的音譯 IRGN1418 *缺少來源參考。
?訁丕 ~話 潮州話,談話 MCLC-1 IRGN1485 or ML-00001 IRGN1549/IRGN1552 *國內的潮汕話書籍不用這個字。
?訁旦 潮州話,說 MCLC-2 IRGN1485 or ML-00002 IRGN1549/IRGN1552 *國內的潮汕話書籍不用這個字。
新加坡
??來攵心 S0-212C IRGN899 =憗
?釒匡 S0-2446 IRGN899 =??
?車太 RW1303 IRGN899 =軚
?魚孟 RW9082 IRGN899 =鯭
?春鳥 RW9246 IRGN899 =??
如果各位認識馬來西亞和新加坡的朋友,能找到這8個字在當地的實際用例,我很希望能將他們編碼。
二、待編碼部分(WS2015 = Ext G)
馬來西亞
?氵閃 閩南方言,客家方言,長度單位 UTC-01784/UK(漢大二)
新加坡
?釒光 RW1421 IRGN899 UTC-02218/UK(漢大二) =銧
?疒積 RW1247 IRGN899 UTC-02664/UK(中華字海) =癪
?釒厄 RW9109 IRGN899 UTC-02678/UK(中華字海) =鈪
?釒吉 RW1488 IRGN899 UTC-02680/UK(中華字海) =銡
這部分字其實算比較常見的,?釒厄是粵方言用字,在廣東多見。英國在WS2015中採用《漢大二》和《中華字海》提交了大量的類推簡化字,。
三、已編碼部分
馬來西亞
?蟲尋 ?? U+2B2BB (GCH-2014.82) IRGN1418
新加坡
?石達 ? U+9FCE (GFC-022) S0-2250 IRGN899
?巾賁 ?? U+2AA78 (GCH-2004.50) S0-223D IRGN899
?糹今 ?? U+2B11B (GCH-4011.54) RW0875 IRGN899
?釒宗 ?? U+2B4FD (GBK-1021.02) RW9272 IRGN899
?蟲喬 ?? U+2B2B8 (GCH-2014.79) RW1407 IRGN899
?蟲尋 ?? U+2B2BB (GCH-2014.82) RW9232 IRGN899
?車翏 ?? U+2B416 (GCH-4018.68) RW0804 IRGN899
?面貴 ?? U+2B583 (GCH-3022.58) S0-2422 IRGN899
?韋?? ?? U+2B594 (GCH-4022.97) S0-243F IRGN899
?兆頁 ?? U+2B5AF (GXC-5023.25) RW9209 IRGN899
?飠胡 ?? U+2B5EB (GXC-3024.06) RW9235 IRGN899
?馬匋 ?? U+2B626 (GCH-5024.96) RW1425 IRGN899
?魚曹 ?? U+2B6A7 (GCH-1027.09) RW9084 IRGN899
?魚巤 ?? U+2B6AD (GCH-4027.31) RW9086 IRGN899
?魚章 ?? U+2B812 (GZH-1716.17) RW9085 IRGN899
?馬余 ?? U+2CCFF (GCH-3024.86) RW1424 IRGN899
已編碼的部分全部來自中國的提交,出處都是中國常見的幾部大型辭書。
雖然新加坡和馬來西亞似乎已不太會在IRG再有活動,但如果當年提交的字確實能反應他們的實際使用漢字情況的話,或許給予橫向擴展是有必要的。
來源參考可以包括以下:
馬來西亞部分:
*MCLC
*MYN1418:IRGN1418提交時候沒有給出來源參考信息,如果要拿他們來做橫向擴展,採用西夏文後來的辦法來解決。如:?舟冬為*MYN1418-1,其餘類推。
新加坡部分:
*S0
*RW:可能更改為*SRW會比較合適。
當然除了馬來西亞和新加坡,還有很多華人地區會有未編碼漢字的情況,這些對我們來說也是可以大有作為的。歡迎各位對東南亞情況的知情者砸字給我。
推薦閱讀:
※在大馬講華語,沒你想的那麼容易 | 針尖多味聽覺館
※出國第一站應該去哪裡玩最合適?
※肉骨茶里沒有茶?這道馬來西亞老少皆宜的美食竟源自百年前的中國。
※吃遍全球—馬來西亞不可錯過的美味伴手禮
TAG:Unicode统一码 | 汉字 | 马来西亚 |