日语汉字「海」(中竖)应该如何输入,为何粘贴在 UTF-8 文档中依然显示为「海」?

参见爱丽丝官网:上海アリス幻樂団

和维基百科【海】:海 - 维基词典,自由的多语言词典

=========================================

粘贴在Notepad中 ,依然显示为:

------------------------------------------------

请教是什么缘故?应如何输入这个汉字?


Unicode 的本意,是给这些含义相同但字形在各个国家或地区有微小不同的字,分配同一个编码。但是,为了与已有的字符集兼容,有些在已有字符集中已经分开编码的字(如「户、戸、戶」),就只能也分开编码了。

「海」的两种字形并未在某种已有字符集中分开编码,所以它们的 Unicode 是一样的,只能通过设置字体来改变字形。

更新: @farter yang 在兼容区中找到了两点的「海」字(U+FA45),果然来自日本,这说明日本有一种字符集同时收录了一竖的「海」字和两点的「海」字。同样的情况也发生在「侮」「悔」「梅」「敏」等以「每」为偏旁的字上。不过,一般情况下并不建议使用兼容区的字,一是因为很多字体不支持,二是查找、搜索起来都是坑。


这两个字形在Unicode里编码是一样的,除了改变字体别无他法。控制面板的“字体”目录下会显示哪些字体“设计用于”日文,选择那些即可。当然,在无法自定义字体的场合就没有任何办法了。

Notepad的“格式-&>字体”一栏中可以自定义字体,比如,如果改成MS Mincho或者MS Gothic等等,那么“海”的两点自然会显示成一竖。

另外,UTF-8只不过是Unicode编码的一种具体实现方式,它自然要求所有字符均有其Unicode码位。从严格意义上来讲,Unicode只是把每个字符映射为一个整数(习惯上用十六进制表示),但并未规定这个十六进制数具体如何存储。


这锅还得让 Unicode 背,因为它对字形差异的处理方式存在双重标准

对于不同地区的字形差异,有的选择了分于不同编码,比如:

(U+5A31)

(U+5A1B)

(U+5A2F)

以上三个字不用切换字体就能直接观察出差异。

但是,有的选择了合并为一个,如:

(U+8AA4)

只给这个字一个编码,所以需要切换字体才能使字形发生改变,如下图:

说明:

  1. 这里「大陆、台湾、日本、韩国」只指适合该语言的字体而非指该字的标准字形

  2. 此例为苹果系统,大陆用华文宋体,台湾用蘋果儷細宋,日本用 Hiragino Mincho Pro,韩国用 AppleMyungjo;

  3. 黑色为该字体有但非当地标准字形的字符,灰色为该字体所不支持的字符(只能以华文宋体表示),蓝色为符合当地标准的字形,青色为当地标准的繁体字或旧字体。

不难发现,「娱、娛、娯」三分中,同一字符不同字体的差异仅仅在笔形的设计,与笔画结构影响不大;而「誤」则是笔画结构各有不同。

题主所提到的「海」字,情况与「誤」字相同。而「每、毎」字,情况又与「娱、娛、娯」字相同。如果题主用的是微软系统,若要显示日本字形,可以用 MS Mincho 字体。

===2016年10月28日补充↓===

日本汉字存在新旧字体之分,比如「拡」与「擴」。但是前面提到了「海」只在基本区分配了一个名额,如果要体现新旧字体差异,Unicode 倒是给它留了一条生路——兼容区汉字。正常情况下使用的「海」字是 U+6D77,但如果要在旧字体的场合下使用,那么兼容区的 U+FA45 就是一种选择。下图所示的是以 Hiragino Kaku Pro 字体显示的两种「海」字,黑色的是基本区,蓝色的是兼容区(只能用日语字体,否则显示出来的「海」的形状完全一样):

关于兼容区,详细问题见:

为什么 Unicode 中会存在「凉」和「凉」这样两个极其相像的字符? - 字体

扩展阅读:“真姬”又怎么写?——中日字形暨 Unicode 字形之议 - 东南西北的文章 - 知乎专栏


结论就是电脑换个字体,下面是jis x 0221-1:2001标准书(其实就是ucs啦)。可以看出只有日本的字形中间相交。

表头从左到右就是cjkv,c处左简右繁

参考下图(之前这张图片上传失败了,我还一直没注意到。。。)


如果你有带 IVD 支持的日文字体的话可以这么干 ↓


换个字体就行了


统一码遵循的是:

兼容所有已有编码和对汉字编码(不是字形)。

所以像这样字义上完全没有区别且在已有编码内并不存在分开编码的字就只有靠字体了。


推薦閱讀:

學習日語給你帶來了哪些機會?
現在最好的背日語單詞的應用或者網站或者軟體是什麼?
記憶日語單詞時,音讀和訓讀漢字各自在哪種情況下出現?
日語里像すっごい、あっま、うっさえ這類形容詞的促音變是年輕人的用語(若言葉)嗎?

TAG:日语 | 中日韩统一表意文字CJK | 新字体日文 |