U外八輔字整理第一批,附帶一些八輔外、U外地名字

先說點與題目無關的,我一直很想寫篇文章說一說的。

首先,我想說這些地名用字早就應該提交,其中的八輔(《信息技術 信息交換用字符集 第八輔助集》【SJ/T 11239-2001】,2001年制定的行業標準)字更是如此。當年G源以一句「難以逐個找證據」放棄了向unicode(統一碼,官方介紹網址:What is Unicode? in Simplified Chinese)提交,致使很多字現在電腦仍無法顯示。如果說第一次撤回提交可以理解,但是拖了16年,錯過了幾次提交,這是無論如何也說不過去的

試想,如果就是你的身份證上有電腦無法顯示的漢字,辦銀行卡,辦駕駛證都需要先開證明才能辦成;所有的電腦除非使用公安局字型檔(涉密,公安系統使用)或者自造字型檔否則無法顯示,這有多不方便?然而如此重要的漢字卻一直少有人來考證

以我的經歷,我承認,考證這些字很有難度,但絕非不可能完成的任務,即使不可能找到全部,也應該儘力去找,專門去找,不能無所作為。

除此之外,我想說一下地名用字標準化的問題。我認為,地名用字是該標準化,但標準化的方式不應該是改,而是收。收,是為方便人民辦事;改,是讓人民為辦事提供方便。並且我國幅員遼闊,文化豐富多彩,自然村眾多,改不可能徹底,還會造成大量地域性文化的流失。80年代進行的地名標準化已經很好地說明了這個問題。縣以上改的很徹底(鄉鎮級並沒有,有下石太鄉,直到擴展G都應該不會收錄),然而後來又改回來了不少;行政村及以上改的比較徹底,而自然村生僻字遺留嚴重。這就造成了一個很尷尬的局面:生僻字仍大量存在(注意是大量),相關文化散失嚴重,自然村名中的生僻字更加難以考證和收錄。對於這種標準化,我認為,不做也罷,不能因為無知,所以無畏,對於所謂的生僻字,只是你不認識,並不代表它用的不廣,就應該被改。這就好比一些書上的知識你不懂,你應該做的是學,而不是把書用塗改液或者修正帶抹了。

來看一看這個字:?門外(擴展E,U+2CBA1) 這個字直到擴展E(2015年6月正式發布)才收,你能說它影響的人不多嗎?即使是一個自然村,也有十幾口幾十口人,他們辦事有多不方便呢?然而還有很多地名字沒有被unicode收錄,而八輔就是這些字的一個大集合。

據@Kushim Jiang 的統計,《信息技術 信息交換用字符集 第八輔助集》中的2501個字,截止到擴展E,還未被unicode收錄1308字。樂觀估計截止到擴展G大概會有900―1000個仍不能被收錄,這就意味著直到擴展G這些字電腦仍然無法顯示,4-6年內電腦仍然無法顯示,4-6年內他們辦銀行卡、學車等等仍然要先開證明。如果下次提交期再錯過,那就是更久的時間。然而已經錯過了16年。

這些字我以前在漢典論壇發過一次,但並未有幾人重視。

除了這些字,我還整理了其它的一些,具體數量請見我的U外地名用字整理總結:U外地名用字整理總結 - 知乎專欄,其餘的我會在日後整理髮表。

如果你想問我為什麼非要考證這些漢字,我只能引用英國登山家喬治·馬洛里的一句話回答:「因為它就在那」。

已經說的夠多,下面是我的第一批整理。

謹以此希望能讓更多人關注Unicode,了解unicode;能讓更多人了解八輔、重視八輔。

推薦閱讀:

八輔字情調查初步資料整理階段完成

TAG:Unicode统一码 | 生僻字 | 地名 |