電腦裡對於同一個漢字字元,中文漢字和日文漢字是用同一個編碼代表嗎?
01-15
是同一個 Unicode 字元。於是在指定編碼模式(比如 UTF-8)下就是同一個編碼。(注意:Unicode 的字符集與編碼這兩層技術是分離、模塊化的。字元本身是抽象的編號對象,編碼是具體存儲的數字信息。)中日文的「微未來」這些漢字共享 Unicode 字元是 Han unification 的結果。有些字形態有顯著差異於是沒能 unify,比如台灣定為正字的「來溫詞倫」。有些字形態其實異但又 unify 了,比如日文標準字形的「天」字兩橫是上長下短,而「微」在中日台三個地區的字形標準也不一樣,這樣造成同一個 Unicode 字元在不同語言的文本中需要不同的字形。與 Han unification 相關的問題還有很多很多。感興趣的話從上面給出的維基百科詞條看起即可。針對編碼,@梁海 回答正確,但「排序」我想補充一下:
1. 第一個級別在操作系統全局方面。在 Mac OS X 中,針對每種語言都有排序設置,即使同樣是簡體中文,你也可以應用程序中都列表選項是按音序或者按照部首排。
第二個級別在應用程序方面。在 iTunes 中,每首樂曲都信息里都有「排序」標籤,右邊「按 XX 排序」這一列里可以輸入自定義的文字列。比如針對同一個 CJK 統一漢字「七」,你可以在右邊「按照名稱排序」裡面輸入「qi」「なな」「しち」等不同地區漢字分別等讀音,這樣自然而然 iTunes 就會按照你制定的方式排序。
順便說一下, 從蘋果官方 iTunes Music Store 日本店下載的曲目里,這些信息都是都事先填好的,因為日文漢字的讀音非常複雜,一字多音很常見,所以這對日語來說是必要的。
對了,別忘了,天朝沒有蘋果官方 iTunes Music Store,你只能手動,或者使用第三方應用程序工具批量添加。當然,如果你什麼都不設置,系統/程序自然默認用 Unicode 的碼位來排順序,這時候 CJK 漢字就是混統合的,按照碼位順序來排,再按照你制定的語言優先順序來指定某種字體來顯示,最後才是你看到的樣子。
參見:CJK統一字符集。
推薦閱讀:
※「=????這=????種=????效=????果」是怎麼實現的?
※除utf-8之外的字元編碼格式是怎麼解決大尾端與小尾端的問題的?
※如何評價不同平台上各種 emoji 的設計?
※如何才能推動國家教育部推出支持Unicode最新版的全漢字宋楷黑仿免費字型檔?
TAG:Unicode統一碼 | UTF-8 | 漢字編碼 |