「中日韓統一表意文字擴展區 B」是什麼?這些如今極度罕用的字在什麼情況下有可能用到?
中日韓統一表意文字擴展區B
你用不到,別人可能用到,你不收錄,就會讓他人痛苦數年甚至數十年。比如《通規》有個字
我小學有個同學名字里就有,後來(在快畢業的時候)就是因為各種證沒法辦,給改了。
ps. SIP 已經快滿了,以後漢字得滾去占 U+4xxxx 了……
「中日韓統一表意文字擴展區 B」是什麼?
你給的鏈接還有其他答主已經回答了該問題。
這些如今極度罕用的字在什麼情況下有可能用到?
先問是不是。
題主知道《通用規範漢字表》嗎?一級字表(常用字)3500字,二級字表(次常用字)3000字,三級字表(通用字,多為地名和科技術語)1605字。
- 一級字全部位於BMP的基本區中;
- 二級字有2個位於擴展B區,還有1個位於擴展E區。
- 三級字有34個位於擴展B區,44個位於擴展C區,8個位於擴展D區,107個位於擴展E區。
綜上,《通規》8105字中,有36個位於擴展B區,44個位於擴展C區,8個位於擴展D區,108個位於擴展E區。
這些都是通用字的範疇,怎麼會罕用呢?加個「極度」就更不對了。
同時,題主還必須考慮到方言、文字學、古籍等領域,有些你覺得罕用的字換個領域可能就是常用字了,不要把視野局限在很小的範圍內。
突然想到,「?」這個字就在A區,而其簡體字在C區,罕用?
CJKV ExtB(The Chinese, Japanese, Korean and Vietnamese Unified Ideographs Extension B)是 SIP 平面下的區塊,其區塊之大目前而言難以超越(古彝文加油)。由於區塊的位置已然超出 BMP 範圍,這意味著這些字不一定能被舊版本的系統和軟體所支持,因此這些字的作用相對特殊,使用範圍也相對較小。
由於擴展 B 區完成之時 IRG 的網站剛剛建成,因而會議文件較少(約 IRG N830 以前),也了解不到么子建制時期的消息。目前看來,
- 擴展 B 區做的仍然大多是 compatibility 的活,導致提交的一部分字僅以「見於某某字符集」為來源,使得音義難考(如 T 源、J 源、V 源)。
- 當時可能對字形證據的要求並不嚴格(或者可能沒有要求),導致提交的另一部分字音義更難考證(如 G4K / GBK / GHC / GCH / GCY / GFZ……)。
- 由於區塊過大以及部首判斷上的疏忽,區塊中存在一些難以忍受的同形字。
- 同先前的回答者們,康熙源和漢大源的收錄怎麼想都是功德無量的事情。
- 由導夫 paper 所提,通用龜飯漢字表中有 36 字位於該區,這些字可以一定程度上解決生活中的錄入問題。當然目前仍然無法肯定公司或者公安部的破軟體們能支持 SIP。
- (有 IVD 的話大部分字都能被?進 BMP 吧)
關於統一碼的情況維基里已經說的很清楚了。中日韓越統一表意文字至於題主說的「收錄這些如今已經不用的字」……在下只能說,題主你是真的沒有遇到過電子化古籍時遇到無法打出來也無法顯示的字,又不好用別字可以替換時候的苦惱啊。我現在之所以還在無可奈何的用死沉的pad來看pdf掃描版的書,很大程度上就是因為有些字字型檔裡面是真心是沒有啊……這也是為何有些專業書要用手寫本的方式來出版的原因。
拓展B區的存在可以說是一件功德無量的事情。它以一己之力完成了幾乎整本康熙字典和大半本漢語大字典的數字化。
雖然裡面確實也有一些港台特產錯別字,以及越南式真 可能永遠都沒有人用的字,但是可以說是瑕不掩瑜,這個字符集給古籍數字化帶來的便利遠大於浪費碼位的痛苦。
而且如果你現在了解一下unicode的收字流程,就知道unicode再也不會有這麼大的魄力去一次性收錄幾萬個漢字,換句話說一旦當年錯過,很可能就沒有什麼機會了。
你只是翻翻《康熙字典》就會知道這些字收的太對了。
你不用不代表別人也用不到, 就好比 - 港台也不用簡化字, 那麼是否 Unicode 中就不用收錄簡化字了呢?
至於擴展 B, 是因為收字工作是分階段的, 所以在制定了基本區以後, 又逐步制定了擴展 A, 擴展 B... 等等.事實上,擴展到B很不不夠用。我想手打一本篋中詞。裡面的一個[辶贊]至今打不出來。儘管擴展F都出來了,卻不收這個字。補充:
鄒祇謨一首
祝英臺近·旅懷用商文毅韻
樹森森,波渺渺,囘首京華路。無限離情,趲數聲鳴?。遙看一片黃雲,兩行綠樹,遮斷卻、故鄉來處。
無情緒。誰念寥落天涯,杯酒和風雨。夢去愁來,消息渾無據。便教兩字平安,三千里外,怎博得、夜深私語。
這個【趲數聲鳴?】的趲,篋中詞刻本做辶贊。
在答者告訴你這個問題的答案時用的到
我最近在看《紅樓夢》,這個著名吧,裡面有很多字都是在unicode擴展ABCDE里的。比如烏刂樹的烏刂字,嫁接樹木的意思,哈哈。《紅樓夢》這樣著名的通俗小說都如此,不著名的各種古書,想必各種生僻字汗牛充棟啊
序號 漢子 Unicode 拼音1 拼音2 拼音3 拼音4 拼音5 區塊 筆畫編碼
1 ? 9FCD gang4 CJK hshpznhzs
2 ? 9FCE da2 ta4 CJK hpszhhpndz
3 ? 9FCF mai4 CJK phhhzhhshpzn
4 287E0 quan1 que4 jue2 CJK-ExtB
5 20164 xi2 hui4 si1 CJK-ExtB
6 20676 ou3 CJK-ExtB
7 21413 kang1 CJK-ExtB
8 25532 e4 CJK-ExtB
9 25562 cao2 CJK-ExtB
10 26221 xu1 CJK-ExtB
11 26676 gu3 CJK-ExtB
12 28408 guang1 CJK-ExtB
13 28678 qi2 zhi1 CJK-ExtB
14 28695 bian4 CJK-ExtB
15 23E23 fen2 pen1 CJK-ExtB
16 28E99 ni4 CJK-ExtB
17 20CD0 bang1 CJK-ExtB
18 2139A pian3 CJK-ExtB
19 235CB dang3 tang4 CJK-ExtB
20 23C97 wei2 CJK-ExtB
21 23C98 wu3 wu2 CJK-ExtB
22 249DB di4 CJK-ExtB
23 24A7D huan2 ye4 yan3 CJK-ExtB
24 24AC9 xie4 CJK-ExtB
25 255A8 zao4 CJK-ExtB
26 25ED7 cha2 CJK-ExtB
27 2648D tong2 CJK-ExtB
28 2677C lv2 CJK-ExtB
29 26B5C zhi1 CJK-ExtB
30 26C21 na4 nuo2 CJK-ExtB
31 27FF9 mu3 CJK-ExtB
32 28B49 ban1 CJK-ExtB
33 28C47 qiu2 CJK-ExtB
34 28C4F da1 CJK-ExtB
35 28C51 huang2 CJK-ExtB
36 28C54 zun1 CJK-ExtB
37 29F7E an1 CJK-ExtB
38 29F83 mian3 CJK-ExtB
39 29F8C kang1 CJK-ExtB
40 2A7DD ji1 CJK-ExtC
41 2A8FB lou3 CJK-ExtC
42 2A917 liao4 CJK-ExtC
43 2AA30 qu1 CJK-ExtC
44 2AA36 she1 CJK-ExtC
45 2AA58 yan3 CJK-ExtC
46 2AFA2 xian4 CJK-ExtC
47 2B127 yan2 xian4 CJK-ExtC
48 2B128 chi1 zhi3 CJK-ExtC
49 2B137 yi4 CJK-ExtC
50 2B138 xun1 CJK-ExtC
51 2B1ED wei3 hua1 kui1 e2 CJK-ExtC
52 2B300 ji4 CJK-ExtC
53 2B363 tong2 dong4 CJK-ExtC
54 2B36F xian2 CJK-ExtC
55 2B372 xiao3 CJK-ExtC
56 2B37D xuan2 CJK-ExtC
57 2B404 yue4 CJK-ExtC
58 2B410 ni2 CJK-ExtC
59 2B413 rou2 CJK-ExtC
60 2B461 meng2 CJK-ExtC
61 2B4E7 fu1 CJK-ExtC
62 2B4EF ji1 CJK-ExtC
63 2B4F6 xuan1 juan1 juan4 CJK-ExtC
64 2B4F9 ji1 CJK-ExtC
65 2B50D fan2 CJK-ExtC
66 2B50E jue2 yu4 CJK-ExtC
67 2B536 nie4 CJK-ExtC
68 2B5AE yi3 CJK-ExtC
69 2B5AF fu3 tao1 tiao4 CJK-ExtC
70 2B5B3 yun1 1-Jun CJK-ExtC
71 2B5E7 su4 CJK-ExtC
72 2B5F4 zhan1 CJK-ExtC
73 2B61C wen2 CJK-ExtC
74 2B61D jue2 kuai4 CJK-ExtC
75 2B626 tao2 CJK-ExtC
76 2B627 lu4 CJK-ExtC
77 2B628 ti2 CJK-ExtC
78 2B62A yuan2 CJK-ExtC
79 2B62C xi2 CJK-ExtC
80 2B695 shi1 CJK-ExtC
81 2B696 ji4 ci3 CJK-ExtC
82 2B6AD lie4 la4 CJK-ExtC
83 2B6ED kuang2 CJK-ExtC
84 2B7A9 men2 CJK-ExtD
85 2B7C5 liang2 jing1 CJK-ExtD
86 2B7E6 sui4 CJK-ExtD
87 2B7F9 hong2 CJK-ExtD
88 2B7FC da2 CJK-ExtD
89 2B806 kui3 CJK-ExtD
90 2B80A xuan2 CJK-ExtD
91 2B81C ni2 CJK-ExtD
92 2B8B8 dan4 chan2 chan3 shan4 da2 CJK-ExtE psdpszhhs
93 2BAC7 e3 wu4 wo4 CJK-ExtE szhhssdphdzdd
94 2BB5F ou1 qiu1 CJK-ExtE hshhpnz
95 2BB62 lun3 lun4 CJK-ExtE hshpnpz
96 2BB7C lao2 CJK-ExtE hshhssdzzp
97 2BB83 shan4 chan3 CJK-ExtE hshdpszhhs
98 2BC1B xing2 CJK-ExtE zphzdhsh
99 2BD77 li4 CJK-ExtE szshpzp
100 2BD87 die2 di4 CJK-ExtE szshsssdzszs
101 2BDF7 xin1 qian4 CJK-ExtE dhpphhhzpzpn
102 2BE29 kou1 CJK-ExtE zhzhpnz
103 2C029 wei3 CJK-ExtE szhhhhzs
104 2C02A xian4 CJK-ExtE szhhszpz
105 2C0A9 jia1 CJK-ExtE hspdhdphpn
106 2C0CA zhi4 CJK-ExtE hspdpphpszpn
107 2C1D5 wan4 CJK-ExtE ddhhzp
108 2C1D9 pei4 CJK-ExtE ddhszpn
109 2C1F9 guo2 CJK-ExtE ddhszhhshdh
110 2C27C ou1 CJK-ExtE dppnhpnz
111 2C288 xun2 CJK-ExtE dppnzhhhsd
112 2C2A4 chan3 dan3 chan4 CJK-ExtE dppndpszhhhs
113 2C317 ya2 CJK-ExtE hzsppnhszh
114 2C35B li4 CJK-ExtE hhshpzspd
115 2C361 dang4 CJK-ExtE ddhzpphhshd
116 2C364 xun2 CJK-ExtE hhshzhhhsd
117 2C488 que4 hu2 CJK-ExtE ddpdzhpszh
118 2C494 geng3 CJK-ExtE hpszhshshszhh
119 2C497 lan2 CJK-ExtE hpszhssphdszpz
120 2C542 long3 gong1 gan3 CJK-ExtE phdphdhshszpn
121 2C613 xun2 CJK-ExtE zzhpss
122 2C618 dan3 CJK-ExtE zzhdzpz
123 2C621 yin1 CJK-ExtE zzhszhpnh
124 2C629 ting1 CJK-ExtE zzhphshzn
125 2C62B huan2 huan4 wan3 CJK-ExtE zzhddzhhpz
126 2C62C qian4 qing1 zheng1 CJK-ExtE zzhhhshszhh
127 2C62D lin2 shen1 chen1 CJK-ExtE zzhhspdhspd
128 2C62F zhun3 zhun4 CJK-ExtE zzhdhszhzsh
129 2C642 yan3 yin3 CJK-ExtE zzhddzhszhshpn
130 2C64A mo4 CJK-ExtE zzhszdphhshddddhsh
131 2C64B xiang1 rang3 sang1 CJK-ExtE zzhdhszhszhhhsshpzpn
132 2C72C man4 CJK-ExtE hssdszszh
133 2C72F liang3 CJK-ExtE hsshszpnpn
134 2C79F pin2 ping2 CJK-ExtE hssshshsdphpszpn
135 2C7C1 yi4 CJK-ExtE hsshszhszdphspzdzh
136 2C7FD dong1 CJK-ExtE szhshdhzspd
137 2C8D9 xu1 xu3 CJK-ExtE dzhhs
138 2C8DE zhu3 CJK-ExtE dzddzh
139 2C8E1 jian4 CJK-ExtE dzhhzpd
140 2C8F3 hen3 CJK-ExtE dzzhhzpn
141 2C907 yin1 CJK-ExtE dzhszsshhsh
142 2C90A shi4 di4 CJK-ExtE dzszhhhshpn
143 2C91D hui4 CJK-ExtE dzhszhhshddzdd
144 2CA02 qi2 CJK-ExtE hzshpzhz
145 2CA0E you2 CJK-ExtE hzshdphszpzhh
146 2CA7D xun2 CJK-ExtE zhhhsdzs
147 2CAA9 nong2 CJK-ExtE hszpzhhdzpzpn
148 2CB29 yi4 CJK-ExtE phhhzhzd
149 2CB2D lun2 CJK-ExtE phhhzpnpz
150 2CB2E chang3 CJK-ExtE phhhzphzn
151 2CB31 jin1 CJK-ExtE phhhzpphs
152 2CB38 shu4 xu4 CJK-ExtE phhhzhspnd
153 2CB39 shen2 shen1 huan2 CJK-ExtE phhhzszhhs
154 2CB3B lu2 CJK-ExtE phhhzshzhp
155 2CB3F zhao1 CJK-ExtE phhhzzpszh
156 2CB41 mu3 CJK-ExtE phhhzzzdhd
157 2CB4A du4 CJK-ExtE phhhzhspdhsh
158 2CB4E hong2 CJK-ExtE phhhzddzhpzd
159 2CB5A chun2 dui4 duo4 CJK-ExtE phhhzdhszhzsh
160 2CB5B bo1 CJK-ExtE phhhzddhzpszn
161 2CB64 hou2 CJK-ExtE phhhzpszhphhpn
162 2CB69 weng1 CJK-ExtE phhhzpnzdzdhzdh
163 2CB6C wei4 CJK-ExtE phhhzhhhshhhszhh
164 2CB6F pie3 CJK-ExtE phhhzdpszspnphpn
165 2CB73 xi3 CJK-ExtE phhhzhshszhdphszh
166 2CB76 hei1 CJK-ExtE phhhzszdphhshdddd
167 2CB78 lin2 CJK-ExtE phhhzdphspnpzdhzs
168 2CB7C sui4 CJK-ExtE phhhzdphpzpppndz
169 2CBB1 yin1 CJK-ExtE dszhszsshhsh
170 2CBBF gai4 ai2 qi2 CJK-ExtE zsszszhz
171 2CBC0 ji1 CJK-ExtE zsdhpnps
172 2CBCE tui2 CJK-ExtE zsszhshszpn
173 2CC56 di2 CJK-ExtE szhshhpszpn
174 2CC5F wei3 CJK-ExtE pzhpzzhpszpn
175 2CCF5 pi1 CJK-ExtE zzhhpsdh
176 2CCF6 jiong1 CJK-ExtE zzhszszh
177 2CCFD shen1 CJK-ExtE zzhphshpz
178 2CCFF tu2 CJK-ExtE zzhpnhhspd
179 2CD02 fei1 CJK-ExtE zzhshhhshhh
180 2CD03 huo1 CJK-ExtE zzhhhshhpszh
181 2CD0A lin2 CJK-ExtE zzhdphspnpzdhzs
182 2CD8B ju1 gou3 qu2 CJK-ExtE pzszhshhpzszh
183 2CD8D tuo2 CJK-ExtE pzszhshhddzpz
184 2CD8F wei2 CJK-ExtE pzszhshhpzhpzz
185 2CD90 zhao4 CJK-ExtE pzszhshhpdhzpn
186 2CD9F la4 CJK-ExtE pzszhshhhszhspdss
187 2CDA0 lian4 CJK-ExtE pzszhshhhszdphspn
188 2CDA8 ji4 CJK-ExtE zhhzdhzpzpzszhshh
189 2CDAD ji4 CJK-ExtE pzszhshhpzddznhhspd
190 2CDAE xi3 xi1 CJK-ExtE pzszhshhhshszhdphszh
191 2CDD5 bu1 pu1 pu2 bu3 CJK-ExtE hszhhsdpzdzh
192 2CE18 yan3 CJK-ExtE hszhhzphzpzdzh
193 2CE1A yue4 CJK-ExtE pzpdzhpndpzdzh
194 2CE23 xian1 CJK-ExtE ddzhhsshpnpzdzh
195 2CE26 zhuo2 CJK-ExtE dhzpphphhpnpzdzh
196 2CE2A fan2 CJK-ExtE pdphspnszhshpzdzh
197 2CE7C xie4 CJK-ExtE shshpnzspnps
198 2CE88 yi3 qi3 CJK-ExtE shshpnzshpnhszhs
199 2CE93 chu3 CJK-ExtE shshpnzshspdhspdzshpn
怕你是沒用過中日韓統一表意文字擴展區 F,2017年Unicode10.0的新修訂。
這些字都是老祖宗留下來的東西。
北京方言有個非常常用的字cèi,知乎上竟然不能顯示,哪怕用瀏覽器查看。
記得應該是GB2312還是這個之前的編碼,某位政界名人幾名字里中間那個字沒有,GBK和GB18030就少一點這樣的煩惱。
戶籍什麼的信息化的時候,生僻字什麼的折騰過不少人吧?我覺得主要還是用於古書。
有一些非常重要的古代著作,如說文、廣韻,裡面某些字到現在都不在電腦上打出來。這些字對於一般現代人而言不重要,但是對於語言文字學來說很重要,不能不考慮。
發表關於古漢語文字的專著經常面臨缺字的難題,得臨時造字,可是這樣的字根本就不能真正儲存到電腦上,更不能傳輸。推薦閱讀:
※規範漢字為什麼有很多字簡化不徹底?
※「線」(缐)和「綫」(線)有什麼區別?
※台灣日常用字中的「你」是寫作「你」還是「妳」?
※為什麼曾經漢字多有異體字?
※「河」字是如何從「江」「淮」「渭」「涇」「漢」等眾多表達「河流」之意的字中脫穎而出成為描述水系最普遍使用的漢字的呢?
TAG:漢字 | Unicode統一碼 | 中日韓統一表意文字CJK | 中日韓統一表意文字擴展區CJKExtension | 生僻字 |