為什麼在日語和漢語寫法不同的漢字中,有的是字元不同,有的只是字體不同?
01-25
在日語和漢語寫法不同的漢字中,有的是字元不同,如「壓」和「圧」,「德」和「徳」,「卷」和「巻」等;有的卻只是字體不同,如「直」「與」「誤」等。對於這些僅是字體不同的漢字,在PC或者手機上,如非網頁特別指定字體,否則隨系統語言顯示的文字在顯示另一種語言的時候,就會出現日語和中文在字體上混淆的情況。這是否是一種不合理的設計?
簡單點說,是個歷史遺留問題。
Unicode在設計的時候,對同一個漢字的相近的不同字形,採取了這麼兩條原則:- 同一個漢字的相近的不同字形,給予相同的編碼;
- 但為了保持與已有編碼方案的兼容性,若某漢字的不同字形在已有的某編碼方案中有不同的編碼,則Unicode也分開。
所以就造成了「戶戸戶」分開,但兩個「直」合併的亂象。
- 相同的漢字,在不同地區(中國大陸 / 港澳台 / 日本 / 韓國)有不同的寫法。這些寫法是漢字在各地傳播、發展的過程中產生的,甚至還有寫錯了卻流傳下來、成為一個異體字的情況。這也是思源黑體這款 Pan-CJK 字體為何要分多個版本的原因——即使是相同的 Unicode 碼位,按照各地區的規範,漢字的外觀也可能不同。
- Unicode 是出現的比較晚的一個計算機字元標準。在此前,各漢字區都有自己的相應標準。在這些標準中,有可能會將寫法不同的漢字歸於不同碼位(如上文提到的「德」和「徳」),也有可能合併(比如「直」)。前者可能是考慮到這兩個字作為異體字都有使用,於是為了兼容而保留;而後者的情況,則是因為在日本並沒有使用「直」這個寫法。Unicode 在吸收各地區標準的時候,自然會以保證兼容性為考慮。
- 現在的網頁開發者,如有可能應當盡量指定網頁的語言,甚至細化到標籤。這樣,如果瀏覽器中為不同語言設定了對應的默認字體,就會調用該字體顯示,避免寫法不匹配。而像是前文提到的思源黑體,在 Adobe InDesign 中,是可以通過字體本身的 "locl" 特性,根據文本框設定的語言而選擇適當寫法的字元的。雖然現在 Pan-CJK 字體就沒多少個,但在設計中盡量考慮到這些因素還是合適的。
推薦閱讀:
※我應該今年七月就考N1,還是七月先考N2,等到12月才考N1呢?
※《綜合日語》這套教材怎麼樣?
※五十音圖沒有記完,想自學,買《大家的日語》合適嗎?
※2017秋季日劇攻略!我追這7部,你呢?