顏文字使用的都是哪些編碼?裡面都有哪些國家的文字?

有些表情可以看出來是夾雜日文組合出來的,但是(??????) ?這樣的表情何解。。。。
PS:想出來這些表情的人也是厲害┳━┳ノ(°_°ノ)

下面再附幾個訊飛輸入法里的這種表情:
?_? (′?皿?`) (?ˉωˉ?) (???_????)
可以把表情拆分開,按字元一個個解釋噠(?ˉωˉ?)。
比如編碼是什麼,使用哪國語言文字這樣。


UTF-8編碼 Unicode字元。

(;′??Д??`)

(;′??Д??`)

(*′ `*)

(*′ `*)


?ˋε′?

?-"?"-?

?-"?"-?


( ?° ?? ?°)


(?′?`?)

_(·?·」∠)_

_(·?·」∠)_


?? ?(′???`)???


(? ??_?? )?

ФAФ

ФAФ

罒 д 罒

罒 д 罒


在這個知乎網頁上能看到的字元,都是用UTF-8編碼的Unicode字元。
剛搜了一下,「?」原來是韓文中眼睛的意思,「?_?」還真形像啊。


  • (??????) ?
    • ( U+0028: 左括弧
    • ? U+0e51: 泰文數字 1
    • ? U+2022: 項目符號圓點,普通標點
    • ?? U+0300: 重音符號,組合字元(合併在前方字元上方)
    • ? U+3142: 韓語字元
    • ? U+2022: 項目符號圓點,普通標點
    • ?? U+0301: 重音符號,組合字元(合併在前方字元上方)
    • ) U+0029: 右括弧
    • U+0020: 空格
    • ? U+2727: 空心四角星,符號
  • ┳━┳ノ(°_°ノ)
    • ┳ U+2533: 製表符
    • ━ U+2501: 製表符
    • ┳ U+2533: 製表符
    • ノ U+30ce: 日語片假名
    • ( U+0028: 左括弧
    • ° U+00b0: 角度符號,非組合字元
    • _ U+005f: 下劃線
    • ° U+00b0: 角度符號,非組合字元
    • ノ U+30ce: 日語片假名
    • ) U+0029: 右括弧
  • ?_?
    • ? U+b208: 韓語字元
    • _ U+005f: 下劃線
    • ? U+b208: 韓語字元
  • (′?皿?`)
    • ( U+0028: 左括弧
    • ′ U+00b4: 重音符號,非組合字元
    • ? U+0b87: 泰米爾語字母
    • 皿 U+76bf: 漢字
    • ? U+0b87: 泰米爾語字母
    • ` U+ff40: 全形重音符號,非組合字元
    • ) U+0029: 右括弧
  • (?ˉωˉ?)
    • ( U+0028: 左括弧
    • ? U+0e51: 泰文數字 1
    • ˉ U+00af: 長音符號,非組合字元
    • ω U+03c9: 希臘文小寫字母
    • ˉ U+00af: 長音符號,非組合字元
    • ? U+0e51: 泰文數字 1
    • ) U+0029: 右括弧
  • (???_????)
    • ( U+0028: 左括弧
    • ? U+0e51: 泰文數字 1
    • ? U+2022: 項目符號圓點,普通標點
    • ?? U+0e35: 泰文母音符號(合併在前方字元上方)
    • _ U+005f: 下劃線
    • ? U+0e40: 泰文母音符號
    • ? U+2022: 項目符號圓點,普通標點
    • ?? U+0e35: 泰文母音符號(合併在前方字元上方)
    • ? U+0e51: 泰文數字 1
    • ) U+0029: 右括弧

(??????) ?

  • ?:泰文 數字 1
  • ??:這個是組合文字和黑點的組合
  • ?:諺文輔音 p

?_?

  • ?:諺文音節 non

(′?皿?`)

  • ?:泰米爾文母音 i

編碼應該是均為UTF-8。

阿拉伯語,例如……沒找著例子。

日語,例如 ̄へ ̄中的へ。

韓語,例如(?ò?ó?)中的?。

西里爾文,例如"(o Д o*)中的Д。

希臘語,例如(*°ω°*)?"中的ω。

還有拉丁字母,中文,藏語等等。

除此之外,還有很多特殊字元,可以在原字元的特定位置在添加符號,例如?( ?? ? ? ?)?中的 ?實際上是一個在原字元下方添加 ?的一個字元。在中文下也適用 ?。

最後補充幾句,其實你把顏文字複製到Word里,全選,按Alt+X可以得到編碼,通過編碼可以查到這個字元的名稱喲~

所以其實查到一個字元的具體名稱是很容易的。


(?ˉωˉ?) 邀請我了?

等下看看這是什麼問題?「?_?」?

好看有點看不懂...Σ( ° △ °|||)︴

讓我想想...(~ ̄(OO) ̄)ブ

該怎麼說呢..o( ̄ヘ ̄o#)

不知道從何說起呢... ╥﹏╥...

還是先保存草稿吧?..o(*^▽^*)┛

總之就先這樣回答.. d=====( ̄▽ ̄*)b

這些顏文字以前是這樣的,比如笑:
:)
:D
:P
後來是這樣的: ̄︶ ̄
然後是這樣的:︿( ̄︶ ̄)︿
最後越來越複雜:

  • ~( ̄▽ ̄~)(~ ̄▽ ̄)~
  • ヾ(≧▽≦*)o
  • *′?`)′?`)*′?`)*′?`)

用到的字元越來越複雜,已經需要動用各類軟鍵盤,使用各類的包括希臘、韓國、日本等國家的文字元,甚至還要加上一些製表符才能做到了。

  • (* ̄rǒ ̄)

所以現在一般都直接自定義到碼錶中,普通的結合字詞作為候選。
比如:
O(∩_∩)O哈哈~ 這應該是搜狗用的最早的一批顏文字
但現在是這樣的:


(註:用雙拼,hj等於han,這個表情表示寒..)

一般不會再像「:)」 這麼簡單到可以直接用英文鍵盤直接打出來了。所以你大可搜索一些喜歡的顏文字,然後自定義編碼,放到輸入法中去。

  • ヽ( ̄ω ̄( ̄ω ̄〃)ゝ 就醬紫,再見。

------------02252100補充---------------

被指責賣萌了。

  • o(TヘTo)

所以還是好說下,首先顏文字本來就是由字元構成的,所以原本是不存在編碼一說,比如最簡單的 @_@~ 或者更原始的 :(

如果你想以這種方式打更複雜的顏文字,比如 :┕( ̄Δ ̄)┒ 單純依靠鍵盤就不成了,需要用到軟鍵盤。其中┕┒ 是製表符,Δ可以在希臘字母中找到。

而在知乎上看到這個賤賤的顏文字更是複雜:( *?ω?)?╰ひ╯ 
其中的剪刀圖案的Unicode編號為U+2704,相同的圖案字元有:??????????????等等。ひ是日文字元。

那麼這些你會一一去單打字元輸出么?還是直接自定義一下短語,或者加入碼錶,給這些表情來個快捷輸出方式呢?
這種快捷自定義,即「編碼」。

一般是這樣做的:

(註:截圖來自搜狗網頁)

(註:截圖來自搜狗網頁)
添加顏表情詞庫之後,就可以通過打棒、爆笑等字詞的編碼得出顏文字的候選,實際上題主提到的訊飛也是這樣加入詞庫中以供候選的。
在這類輸入法的內部,其實就是bang=(??????) ?這樣映射。

另外可以通過碼錶定義來使用一些一些特別的,自創的,有意思的顏文字。比如剛剛那個剪JJ的表情,可以直接加入碼錶或者自定義短語即可。

比如

(註:雙拼jmjiji等於jian ji ji)

(註:雙拼jmjiji等於jian ji ji)
這樣即可。用其他輸入法也可以,甚至更方便。另外注意排列一下候選序列,一般不要把顏文字弄到第一個。

關於問題中提到的幾個顏文字,其中?是泰米爾語字元,д是西里爾文字母。


漢字能組成很立體的顏文字,比如:
吃我魔貫光殺炮!!д?)σ弌弌弌弌弌弌弌弌弌弌?


凡是曲里拐彎的,就像從兜里拿出來的耳機那樣的符號,多數是南亞東南亞那邊的文字

凡是主要由橫線豎線組成的,一般是諺文

最右邊的筆畫是個豎,而且拖的長長的,多數是藏文梵文之流

最右邊的符號個頭高。後面跟著的符號個頭矮,就像一堆曲線,時不時點倆點的,那是阿拉伯波斯維吾爾的字母

就像各種小短棍兒擺成的文字是希伯萊字

豎著寫的像毛毛蟲那樣的一般都是蒙古字,滿文
新蒙古文用西里爾文,也就是俄羅斯用的那種有反過來寫的N

一看就是物理學常用字的文字,那是希臘文


知乎的網頁用的是UTF-8編碼的Unicode字元。
你可以下載一個Unicode的字符集搜索一下具體每個字元是什麼來源。http://www.unicode.org/Public/7.0.0/charts/CodeCharts.pdf(話說一個不到100M的PDF包含了世界上所有的字元真是

啊更新。。現在http://www.unicode.org/Public/9.0.0/charts/CodeCharts.pdf第九版過100M了


搜狗輸入法的顏文字是按照UTF-16編碼的Unicode字元。

當題主將顏文字上屏到知乎時,實際上網頁已經對上屏的顏文字重新編碼,變成了知乎頁面遵循的UTF-8的編碼方式。

另外,如果大家對顏文字感興趣的話,可以到搜狗輸入法顏文字的活動頁下載顏文字包,也可以創建屬於自己的顏文字並上傳,具體的地址為:搜狗顏文字


Unicode字符集,有若干種編碼



  (→_→)人(^—^(( ←_← )

  1998年,竇偉偉結合河圖洛書的傳說與世宗大王造字的故事,創製了真正意義上由多語言橫排符號組合的顏文字教學體系。多語言的文化包容性和字元多樣性,讓顏文字有了數以萬計的單行象形文字組合形式,並成為獨立於 ASCII art 和 JIS art 等多行符號擬圖藝術的亞文化現象,最終發展成為影響全球的世界文化符號。

  最初,竇偉偉製作的多語言橫排符號組合中,以朝鮮語諺文字母為主,中日文字符集為輔。這種多語言橫排符號組合的表達方式,不僅個性而且好玩,吸引了許多人的關注。為了方便介紹這些多語言橫排符號組合,竇偉偉取「顏」字的諧音與含義,把這種多語言橫排符號組合稱為「顏文字」。顏文字教學體系的推出,是顏文字創製的里程碑性事件,使得顏文字通過外語學習社群得以快速傳播。

  1999年,顏文字(kaomoji)的叫法在日語社群中也被固定下來。2000年之後,瀏覽器多語言支持逐漸成熟,顏文字在中國、日本、韓國等東亞地區廣為傳播。時至今日,顏文字作為亞洲網路流行文化的重要組成部分,已經成為一種超越語言的表達方式。

  當前,中國已經成為世界上顏文字用戶最多的國家。顏文字以其獨特的魅力,成長為一種「萌」感十足的亞洲文化現象,極大豐富了世界互聯網文化的情感傳播。

  在2000年之前,顏文字(kaomoji)在日本主要是指 JIS art 多行符號人臉擬圖藝術,並且JIS編碼方式不支持多語言字元顯示。實際上直到2002年,日文的平假名片假名字元在顏文字體系中佔比例仍然極低,甚至遠沒有泰語、阿拉伯語、敘利亞語字元的應用比例高(例:(????)??)。

  在人類歷史上,偶爾使用類似顏文字元號的現象非常普遍。從中國史前文明石刻到近代書法都有顏文字化的雛形,這些類似的表現形式,在當代人的眼中很難被解釋為創作顏文字,更多是歸於石刻藝術和書法藝術。無獨有偶,從美國到日本,有人偶爾無聊,在電腦打出一些類似顏文字的電腦符號組合,之後自己都不再使用的現象,並不是真正意義上的製作顏文字。更不要說那些日本藝術家,通過採用 JIS art 創作方式,製做類似美國 ASCII art 多行符號模擬圖片藝術,本身就是獨立於顏文字之外的藝術形式。

  日本電視、雜誌和報紙等主流媒體接受顏文字(kaomoji)比中國早,並且有一些顏文字周邊商家參與炒作,形成了顏文字起源於日本的假象。


學了俄語之後,發現自己學了整套的顏文字素材(°Д°)Ъ


是 Unicode 來著,Unicode 也叫萬國碼,基本包含了所有國家的文字和符號

以前寫過 Unicode 的一個在線工具,可以根據文字查詢某個字元是哪個國家的文字

http://tool.yunser.com/unicode


Θ..Θ
希臘字母 Theta


顏文字證明了象形文字出現的合理性~


??*( ?o? )*°゜?°?(??? ? ???)??????????????????????????


顏文字只是幾個字元,跟編碼沒有任何關係。具體要在內存或硬碟中表示的時候,愛用 UTF-8 用 UTF-8,愛用 UTF-16 用 UTF-16。


??_??泰文,字面意思是「嘻嘻」中間橫線無意義


推薦閱讀:

TAG:輸入法 | Unicode(統一碼) | 字元編碼 | 冷知識 | 小語種 |