為何Unicode中有字形完全相同的CJK字元?

Unicode的CJK表意文字兼容區有兩塊,一塊是U+F900~U+FAFFCJK Compatibility Ideographs :

http://www.unicode.org/charts/PDF/UF900.pdf

另一塊是U+2F800~U+2FA1F CJK Compatibility Ideographs Supplement。

http://www.unicode.org/charts/PDF/U2F800.pdf

1.這裡面大多數字元和非兼容區的文字是有字形的差別的,但是有些長的和非兼容區文字一模一樣,這個問題我在網上搜索了一下,貌似是說一個韓國字源按讀音編碼,所以有多音字重複編碼現象,導致Unicode CJK兼容區出現字形完全一樣的漢字。但是我查了Unicode官方PDF,裡面好像有些標註T0的漢字也有字形一樣重複編碼的現象,T0不是台灣源嗎?難道T0這個台灣源也按讀音編碼漢字導致多音字重複編碼?

2.Unicode官方的PDF文件裡面一直都能顯示出所有的字元,而我電腦上的字體或多或少都有缺字,我知道PDF可以內嵌字體,那官方它用的是什麼字體而從來不缺字呢(尤其是漢字)?

3.U+1100~U+11FF Hangul Jamo

http://www.unicode.org/charts/PDF/U1100.pdf

U+3130~U+318F Hangul Compatibility Jamo

http://www.unicode.org/charts/PDF/U3130.pdf

倆區塊的字形很多是一樣的,那麼要輸入高麗語字母應該使用哪個區塊呢?


  1. 自己去看《The Unicode Standard — Core Specification》12.1 HanCJK Compatibility IdeographsCJK Compatibility Supplement 兩節,解釋得足夠清楚了。

    「這裡面大多數字元和非兼容區的文字是有字形的差別的」?—— Unicode 不是以 glyph 外觀來分配碼位的,一個字元的 glyph 外觀也不是唯一的。你看到的絕大多數「差別」僅僅是因為在 Compatibility 區塊的 code chart 里使用了該字元來源地區的標準字形,而其對應的 Unified 字元常有多個來源因而字形與 Compatibility 字元常常不一致。

    Code chart 中用「≡」清楚地標明了,絕大多數 Compatibility 字元和其對應的 Unified 字元是 canonical equivalent 關係。
  2. 沒有任何一種字體能滿足 code chart 所有漢字顯示的需求,那是多個字體共同使用的結果。

    自己去看 code chart 的字體提供方信息:Font Contributors Acknowledgements

    而且你自己也能看到 PDF 內嵌字體的信息:[1]

  3. 自己去看《The Unicode Standard — Core Specification》的 12.6 Hangul

    「高麗語字母」?我們稱 Hangul 為「諺文」(政治中立)或「韓字」或「朝鮮字」。「高麗語字母」有特指中古朝鮮語的意味。

[1] PDF 內嵌字體的信息:


推薦閱讀:

為什麼網頁上的韓國漢字複製粘貼之後就變成中國漢字了?
文字設計 (Typography) 的意義是什麼?
為什麼所有設計上有水平的網站在 Mac OS X 下用 Safari 瀏覽時網頁字體都是默認的華文黑體,而土鱉網站都是宋體?
iMac上Safari的默認的字體大小看起來有鋸齒,有些彆扭?
Tao Chen 設計的這款中文哥特體怎麼樣?

TAG:字體 | Unicode統一碼 |