「中日韓統一表意文字擴展區 B」是什麼?這些如今極度罕用的字在什麼情況下有可能用到?

中日韓統一表意文字擴展區B


你用不到,別人可能用到,你不收錄,就會讓他人痛苦數年甚至數十年。比如《通規》有個字

我小學有個同學名字里就有,後來(在快畢業的時候)就是因為各種證沒法辦,給改了。

ps. SIP 已經快滿了,以後漢字得滾去占 U+4xxxx 了……


「中日韓統一表意文字擴展區 B」是什麼?

你給的鏈接還有其他答主已經回答了該問題。

這些如今極度罕用的字在什麼情況下有可能用到?

先問是不是。

題主知道《通用規範漢字表》嗎?一級字表(常用字)3500字,二級字表(次常用字)3000字,三級字表(通用字,多為地名和科技術語)1605字。

  • 一級字全部位於BMP的基本區中;
  • 二級字有2個位於擴展B區,還有1個位於擴展E區。
  • 三級字有34個位於擴展B區,44個位於擴展C區,8個位於擴展D區,107個位於擴展E區。

綜上,《通規》8105字中,有36個位於擴展B區,44個位於擴展C區,8個位於擴展D區,108個位於擴展E區。

這些都是通用字的範疇,怎麼會罕用呢?加個「極度」就更不對了。

同時,題主還必須考慮到方言、文字學、古籍等領域,有些你覺得罕用的字換個領域可能就是常用字了,不要把視野局限在很小的範圍內。

突然想到,「?」這個字就在A區,而其簡體字在C區,罕用?


CJKV ExtB(The Chinese, Japanese, Korean and Vietnamese Unified Ideographs Extension B)是 SIP 平面下的區塊,其區塊之大目前而言難以超越(古彝文加油)。由於區塊的位置已然超出 BMP 範圍,這意味著這些字不一定能被舊版本的系統和軟體所支持,因此這些字的作用相對特殊,使用範圍也相對較小。

由於擴展 B 區完成之時 IRG 的網站剛剛建成,因而會議文件較少(約 IRG N830 以前),也了解不到么子建制時期的消息。目前看來,

  1. 擴展 B 區做的仍然大多是 compatibility 的活,導致提交的一部分字僅以「見於某某字符集」為來源,使得音義難考(如 T 源、J 源、V 源)。
  2. 當時可能對字形證據的要求並不嚴格(或者可能沒有要求),導致提交的另一部分字音義更難考證(如 G4K / GBK / GHC / GCH / GCY / GFZ……)。
  3. 由於區塊過大以及部首判斷上的疏忽,區塊中存在一些難以忍受的同形字。
  4. 同先前的回答者們,康熙源和漢大源的收錄怎麼想都是功德無量的事情。
  5. 由導夫 paper 所提,通用龜飯漢字表中有 36 字位於該區,這些字可以一定程度上解決生活中的錄入問題。當然目前仍然無法肯定公司或者公安部的破軟體們能支持 SIP。
  6. 有 IVD 的話大部分字都能被?進 BMP 吧


關於統一碼的情況維基里已經說的很清楚了。中日韓越統一表意文字

至於題主說的「收錄這些如今已經不用的字」……在下只能說,題主你是真的沒有遇到過電子化古籍時遇到無法打出來也無法顯示的字,又不好用別字可以替換時候的苦惱啊。

我現在之所以還在無可奈何的用死沉的pad來看pdf掃描版的書,很大程度上就是因為有些字字型檔裡面是真心是沒有啊……

這也是為何有些專業書要用手寫本的方式來出版的原因。


拓展B區的存在可以說是一件功德無量的事情。它以一己之力完成了幾乎整本康熙字典和大半本漢語大字典的數字化。

雖然裡面確實也有一些港台特產錯別字,以及越南式真 可能永遠都沒有人用的字,但是可以說是瑕不掩瑜,這個字符集給古籍數字化帶來的便利遠大於浪費碼位的痛苦。

而且如果你現在了解一下unicode的收字流程,就知道unicode再也不會有這麼大的魄力去一次性收錄幾萬個漢字,換句話說一旦當年錯過,很可能就沒有什麼機會了。


你只是翻翻《康熙字典》就會知道這些字收的太對了。


你不用不代表別人也用不到, 就好比 - 港台也不用簡化字, 那麼是否 Unicode 中就不用收錄簡化字了呢?

至於擴展 B, 是因為收字工作是分階段的, 所以在制定了基本區以後, 又逐步制定了擴展 A, 擴展 B... 等等.


事實上,擴展到B很不不夠用。我想手打一本篋中詞。裡面的一個[辶贊]至今打不出來。儘管擴展F都出來了,卻不收這個字。

補充:

鄒祇謨一首

祝英臺近·旅懷用商文毅韻

樹森森,波渺渺,囘首京華路。無限離情,數聲鳴?。遙看一片黃雲,兩行綠樹,遮斷卻、故鄉來處。

無情緒。誰念寥落天涯,杯酒和風雨。夢去愁來,消息渾無據。便教兩字平安,三千里外,怎博得、夜深私語。

這個【數聲鳴?】的趲,篋中詞刻本做辶贊。


在答者告訴你這個問題的答案時用的到


我最近在看《紅樓夢》,這個著名吧,裡面有很多字都是在unicode擴展ABCDE里的。比如烏刂樹的烏刂字,嫁接樹木的意思,哈哈。《紅樓夢》這樣著名的通俗小說都如此,不著名的各種古書,想必各種生僻字汗牛充棟啊


序號 漢子 Unicode 拼音1 拼音2 拼音3 拼音4 拼音5 區塊 筆畫編碼

1 ? 9FCD gang4 CJK hshpznhzs

2 ? 9FCE da2 ta4 CJK hpszhhpndz

3 ? 9FCF mai4 CJK phhhzhhshpzn

4 287E0 quan1 que4 jue2 CJK-ExtB

5 20164 xi2 hui4 si1 CJK-ExtB

6 20676 ou3 CJK-ExtB

7 21413 kang1 CJK-ExtB

8 25532 e4 CJK-ExtB

9 25562 cao2 CJK-ExtB

10 26221 xu1 CJK-ExtB

11 26676 gu3 CJK-ExtB

12 28408 guang1 CJK-ExtB

13 28678 qi2 zhi1 CJK-ExtB

14 28695 bian4 CJK-ExtB

15 23E23 fen2 pen1 CJK-ExtB

16 28E99 ni4 CJK-ExtB

17 20CD0 bang1 CJK-ExtB

18 2139A pian3 CJK-ExtB

19 235CB dang3 tang4 CJK-ExtB

20 23C97 wei2 CJK-ExtB

21 23C98 wu3 wu2 CJK-ExtB

22 249DB di4 CJK-ExtB

23 24A7D huan2 ye4 yan3 CJK-ExtB

24 24AC9 xie4 CJK-ExtB

25 255A8 zao4 CJK-ExtB

26 25ED7 cha2 CJK-ExtB

27 2648D tong2 CJK-ExtB

28 2677C lv2 CJK-ExtB

29 26B5C zhi1 CJK-ExtB

30 26C21 na4 nuo2 CJK-ExtB

31 27FF9 mu3 CJK-ExtB

32 28B49 ban1 CJK-ExtB

33 28C47 qiu2 CJK-ExtB

34 28C4F da1 CJK-ExtB

35 28C51 huang2 CJK-ExtB

36 28C54 zun1 CJK-ExtB

37 29F7E an1 CJK-ExtB

38 29F83 mian3 CJK-ExtB

39 29F8C kang1 CJK-ExtB

40 2A7DD ji1 CJK-ExtC

41 2A8FB lou3 CJK-ExtC

42 2A917 liao4 CJK-ExtC

43 2AA30 qu1 CJK-ExtC

44 2AA36 she1 CJK-ExtC

45 2AA58 yan3 CJK-ExtC

46 2AFA2 xian4 CJK-ExtC

47 2B127 yan2 xian4 CJK-ExtC

48 2B128 chi1 zhi3 CJK-ExtC

49 2B137 yi4 CJK-ExtC

50 2B138 xun1 CJK-ExtC

51 2B1ED wei3 hua1 kui1 e2 CJK-ExtC

52 2B300 ji4 CJK-ExtC

53 2B363 tong2 dong4 CJK-ExtC

54 2B36F xian2 CJK-ExtC

55 2B372 xiao3 CJK-ExtC

56 2B37D xuan2 CJK-ExtC

57 2B404 yue4 CJK-ExtC

58 2B410 ni2 CJK-ExtC

59 2B413 rou2 CJK-ExtC

60 2B461 meng2 CJK-ExtC

61 2B4E7 fu1 CJK-ExtC

62 2B4EF ji1 CJK-ExtC

63 2B4F6 xuan1 juan1 juan4 CJK-ExtC

64 2B4F9 ji1 CJK-ExtC

65 2B50D fan2 CJK-ExtC

66 2B50E jue2 yu4 CJK-ExtC

67 2B536 nie4 CJK-ExtC

68 2B5AE yi3 CJK-ExtC

69 2B5AF fu3 tao1 tiao4 CJK-ExtC

70 2B5B3 yun1 1-Jun CJK-ExtC

71 2B5E7 su4 CJK-ExtC

72 2B5F4 zhan1 CJK-ExtC

73 2B61C wen2 CJK-ExtC

74 2B61D jue2 kuai4 CJK-ExtC

75 2B626 tao2 CJK-ExtC

76 2B627 lu4 CJK-ExtC

77 2B628 ti2 CJK-ExtC

78 2B62A yuan2 CJK-ExtC

79 2B62C xi2 CJK-ExtC

80 2B695 shi1 CJK-ExtC

81 2B696 ji4 ci3 CJK-ExtC

82 2B6AD lie4 la4 CJK-ExtC

83 2B6ED kuang2 CJK-ExtC

84 2B7A9 men2 CJK-ExtD

85 2B7C5 liang2 jing1 CJK-ExtD

86 2B7E6 sui4 CJK-ExtD

87 2B7F9 hong2 CJK-ExtD

88 2B7FC da2 CJK-ExtD

89 2B806 kui3 CJK-ExtD

90 2B80A xuan2 CJK-ExtD

91 2B81C ni2 CJK-ExtD

92 2B8B8 dan4 chan2 chan3 shan4 da2 CJK-ExtE psdpszhhs

93 2BAC7 e3 wu4 wo4 CJK-ExtE szhhssdphdzdd

94 2BB5F ou1 qiu1 CJK-ExtE hshhpnz

95 2BB62 lun3 lun4 CJK-ExtE hshpnpz

96 2BB7C lao2 CJK-ExtE hshhssdzzp

97 2BB83 shan4 chan3 CJK-ExtE hshdpszhhs

98 2BC1B xing2 CJK-ExtE zphzdhsh

99 2BD77 li4 CJK-ExtE szshpzp

100 2BD87 die2 di4 CJK-ExtE szshsssdzszs

101 2BDF7 xin1 qian4 CJK-ExtE dhpphhhzpzpn

102 2BE29 kou1 CJK-ExtE zhzhpnz

103 2C029 wei3 CJK-ExtE szhhhhzs

104 2C02A xian4 CJK-ExtE szhhszpz

105 2C0A9 jia1 CJK-ExtE hspdhdphpn

106 2C0CA zhi4 CJK-ExtE hspdpphpszpn

107 2C1D5 wan4 CJK-ExtE ddhhzp

108 2C1D9 pei4 CJK-ExtE ddhszpn

109 2C1F9 guo2 CJK-ExtE ddhszhhshdh

110 2C27C ou1 CJK-ExtE dppnhpnz

111 2C288 xun2 CJK-ExtE dppnzhhhsd

112 2C2A4 chan3 dan3 chan4 CJK-ExtE dppndpszhhhs

113 2C317 ya2 CJK-ExtE hzsppnhszh

114 2C35B li4 CJK-ExtE hhshpzspd

115 2C361 dang4 CJK-ExtE ddhzpphhshd

116 2C364 xun2 CJK-ExtE hhshzhhhsd

117 2C488 que4 hu2 CJK-ExtE ddpdzhpszh

118 2C494 geng3 CJK-ExtE hpszhshshszhh

119 2C497 lan2 CJK-ExtE hpszhssphdszpz

120 2C542 long3 gong1 gan3 CJK-ExtE phdphdhshszpn

121 2C613 xun2 CJK-ExtE zzhpss

122 2C618 dan3 CJK-ExtE zzhdzpz

123 2C621 yin1 CJK-ExtE zzhszhpnh

124 2C629 ting1 CJK-ExtE zzhphshzn

125 2C62B huan2 huan4 wan3 CJK-ExtE zzhddzhhpz

126 2C62C qian4 qing1 zheng1 CJK-ExtE zzhhhshszhh

127 2C62D lin2 shen1 chen1 CJK-ExtE zzhhspdhspd

128 2C62F zhun3 zhun4 CJK-ExtE zzhdhszhzsh

129 2C642 yan3 yin3 CJK-ExtE zzhddzhszhshpn

130 2C64A mo4 CJK-ExtE zzhszdphhshddddhsh

131 2C64B xiang1 rang3 sang1 CJK-ExtE zzhdhszhszhhhsshpzpn

132 2C72C man4 CJK-ExtE hssdszszh

133 2C72F liang3 CJK-ExtE hsshszpnpn

134 2C79F pin2 ping2 CJK-ExtE hssshshsdphpszpn

135 2C7C1 yi4 CJK-ExtE hsshszhszdphspzdzh

136 2C7FD dong1 CJK-ExtE szhshdhzspd

137 2C8D9 xu1 xu3 CJK-ExtE dzhhs

138 2C8DE zhu3 CJK-ExtE dzddzh

139 2C8E1 jian4 CJK-ExtE dzhhzpd

140 2C8F3 hen3 CJK-ExtE dzzhhzpn

141 2C907 yin1 CJK-ExtE dzhszsshhsh

142 2C90A shi4 di4 CJK-ExtE dzszhhhshpn

143 2C91D hui4 CJK-ExtE dzhszhhshddzdd

144 2CA02 qi2 CJK-ExtE hzshpzhz

145 2CA0E you2 CJK-ExtE hzshdphszpzhh

146 2CA7D xun2 CJK-ExtE zhhhsdzs

147 2CAA9 nong2 CJK-ExtE hszpzhhdzpzpn

148 2CB29 yi4 CJK-ExtE phhhzhzd

149 2CB2D lun2 CJK-ExtE phhhzpnpz

150 2CB2E chang3 CJK-ExtE phhhzphzn

151 2CB31 jin1 CJK-ExtE phhhzpphs

152 2CB38 shu4 xu4 CJK-ExtE phhhzhspnd

153 2CB39 shen2 shen1 huan2 CJK-ExtE phhhzszhhs

154 2CB3B lu2 CJK-ExtE phhhzshzhp

155 2CB3F zhao1 CJK-ExtE phhhzzpszh

156 2CB41 mu3 CJK-ExtE phhhzzzdhd

157 2CB4A du4 CJK-ExtE phhhzhspdhsh

158 2CB4E hong2 CJK-ExtE phhhzddzhpzd

159 2CB5A chun2 dui4 duo4 CJK-ExtE phhhzdhszhzsh

160 2CB5B bo1 CJK-ExtE phhhzddhzpszn

161 2CB64 hou2 CJK-ExtE phhhzpszhphhpn

162 2CB69 weng1 CJK-ExtE phhhzpnzdzdhzdh

163 2CB6C wei4 CJK-ExtE phhhzhhhshhhszhh

164 2CB6F pie3 CJK-ExtE phhhzdpszspnphpn

165 2CB73 xi3 CJK-ExtE phhhzhshszhdphszh

166 2CB76 hei1 CJK-ExtE phhhzszdphhshdddd

167 2CB78 lin2 CJK-ExtE phhhzdphspnpzdhzs

168 2CB7C sui4 CJK-ExtE phhhzdphpzpppndz

169 2CBB1 yin1 CJK-ExtE dszhszsshhsh

170 2CBBF gai4 ai2 qi2 CJK-ExtE zsszszhz

171 2CBC0 ji1 CJK-ExtE zsdhpnps

172 2CBCE tui2 CJK-ExtE zsszhshszpn

173 2CC56 di2 CJK-ExtE szhshhpszpn

174 2CC5F wei3 CJK-ExtE pzhpzzhpszpn

175 2CCF5 pi1 CJK-ExtE zzhhpsdh

176 2CCF6 jiong1 CJK-ExtE zzhszszh

177 2CCFD shen1 CJK-ExtE zzhphshpz

178 2CCFF tu2 CJK-ExtE zzhpnhhspd

179 2CD02 fei1 CJK-ExtE zzhshhhshhh

180 2CD03 huo1 CJK-ExtE zzhhhshhpszh

181 2CD0A lin2 CJK-ExtE zzhdphspnpzdhzs

182 2CD8B ju1 gou3 qu2 CJK-ExtE pzszhshhpzszh

183 2CD8D tuo2 CJK-ExtE pzszhshhddzpz

184 2CD8F wei2 CJK-ExtE pzszhshhpzhpzz

185 2CD90 zhao4 CJK-ExtE pzszhshhpdhzpn

186 2CD9F la4 CJK-ExtE pzszhshhhszhspdss

187 2CDA0 lian4 CJK-ExtE pzszhshhhszdphspn

188 2CDA8 ji4 CJK-ExtE zhhzdhzpzpzszhshh

189 2CDAD ji4 CJK-ExtE pzszhshhpzddznhhspd

190 2CDAE xi3 xi1 CJK-ExtE pzszhshhhshszhdphszh

191 2CDD5 bu1 pu1 pu2 bu3 CJK-ExtE hszhhsdpzdzh

192 2CE18 yan3 CJK-ExtE hszhhzphzpzdzh

193 2CE1A yue4 CJK-ExtE pzpdzhpndpzdzh

194 2CE23 xian1 CJK-ExtE ddzhhsshpnpzdzh

195 2CE26 zhuo2 CJK-ExtE dhzpphphhpnpzdzh

196 2CE2A fan2 CJK-ExtE pdphspnszhshpzdzh

197 2CE7C xie4 CJK-ExtE shshpnzspnps

198 2CE88 yi3 qi3 CJK-ExtE shshpnzshpnhszhs

199 2CE93 chu3 CJK-ExtE shshpnzshspdhspdzshpn


怕你是沒用過中日韓統一表意文字擴展區 F,2017年Unicode10.0的新修訂。

這些字都是老祖宗留下來的東西。


北京方言有個非常常用的字cèi,知乎上竟然不能顯示,哪怕用瀏覽器查看。


記得應該是GB2312還是這個之前的編碼,某位政界名人幾名字里中間那個字沒有,GBK和GB18030就少一點這樣的煩惱。

戶籍什麼的信息化的時候,生僻字什麼的折騰過不少人吧?


我覺得主要還是用於古書。

有一些非常重要的古代著作,如說文、廣韻,裡面某些字到現在都不在電腦上打出來。這些字對於一般現代人而言不重要,但是對於語言文字學來說很重要,不能不考慮。

發表關於古漢語文字的專著經常面臨缺字的難題,得臨時造字,可是這樣的字根本就不能真正儲存到電腦上,更不能傳輸。


推薦閱讀:

規範漢字為什麼有很多字簡化不徹底?
「線」(缐)和「綫」(線)有什麼區別?
台灣日常用字中的「你」是寫作「你」還是「妳」?
為什麼曾經漢字多有異體字?
「河」字是如何從「江」「淮」「渭」「涇」「漢」等眾多表達「河流」之意的字中脫穎而出成為描述水系最普遍使用的漢字的呢?

TAG:漢字 | Unicode統一碼 | 中日韓統一表意文字CJK | 中日韓統一表意文字擴展區CJKExtension | 生僻字 |