要往 Unicode 里添加符號需要經過什麼樣的流程?
01-15
Unicode 里有 ? ? ? 這樣的符號。假如要把「宣和」、「萬曆」這樣的年號加進去,應該怎麼做?
- 確認自己想要的字元(character)並未出現在 Unicode 之 code charts [1]中。這一步並不直觀,務必參考 [2]。
- 確認自己想要的字元並未出現在提請添加的 Pipeline Table [3] 以及 Proposed New Scripts [4] 中。
- 書寫新字元的提案(proposal),包括發起人的身份、地址、電郵、電話之類,使用 Unicode 的術語,尤其要搞清楚字元(character)與字形(glyph)的區別。
- 以下內容可以在官方的提交導引[5]中找到,摘要如下:
- 提案中應盡說明新提交字元可能由哪些既有字元構成,以及為什麼這些既有字元不能滿足需求,這大概是最重要的一步,也就是 rationale。(警告:以下為原創研究)以題目中的需求看來,U+337B 「SQUARE ERA NAME HEISEI」這樣的字元其實是U+5E73(平)與U+6210(成)組合而來的,但是為什麼不能利用單獨的兩個字元呢?我想答案也許是,日本一直有年號,而近代印刷系統也一直有將年號縮印為一個字元的習慣,故而可以。而中文一來現已無年號(我也未見「民國」二字縮印為一個字元的狀況),二來有過年號的時代里,年號也從未縮合印刷過,所以將年號提交為 Unicode 的理由並不充分。
- 將所有新字元列表,逐一說明意義,給出參考來源(警告:以下為原創研究)而這一步對於題目中的例子而言也是非常困難的。
- 填寫專用於提交新字元的 "ISO/IEC JTC 1/SC 2/WG 2 PROPOSAL SUMMARY FORM TO ACCOMPANY SUBMISSIONS FOR ADDITIONS TO THE REPERTOIRE OF ISO/IEC 10646" 表格。
- 寄送 Unicode Consortium,等待審批。
- 最後,如果打算長期貢獻,可以考慮加入 Unicode Consortium [6]。
務必詳細反覆閱讀 [5]。
[1] http://www.unicode.org/charts/index.html[2] http://www.unicode.org/standard/where/[3] http://www.unicode.org/alloc/Pipeline.html[4] http://www.unicode.org/pending/pending.html
[5] http://www.unicode.org/pending/proposals.html[6] http://www.unicode.org/consortium/join.html推薦閱讀:
※給在美國的外國人發郵件,郵件中出現的漢字能正常顯示嗎?
※Microsoft開發記事本的團隊,是不是使用了一個非常弱智的行為來保存UTF-8編碼的文件?
※一個特殊的亂碼問題?
※計算機系統是如何顯示一個字元的?
TAG:Unicode統一碼 | 字元編碼 |