顏文字使用的都是哪些編碼?裡面都有哪些國家的文字?
有些表情可以看出來是夾雜日文組合出來的,但是(??????) ?這樣的表情何解。。。。
PS:想出來這些表情的人也是厲害┳━┳ノ(°_°ノ)下面再附幾個訊飛輸入法里的這種表情:
?_? (′?皿?`) (?ˉωˉ?) (???_????)
可以把表情拆分開,按字元一個個解釋噠(?ˉωˉ?)。
比如編碼是什麼,使用哪國語言文字這樣。
UTF-8編碼 Unicode字元。
(;′??Д??`)
(;′??Д??`)(*′ `*)
(*′ `*)?ˋε′?
?-"?"-?
?-"?"-?
( ?° ?? ?°)
(?′?`?)
_(·?·」∠)_
_(·?·」∠)_?? ?(′???`)???
(? ??_?? )?
ФAФ
ФAФ罒 д 罒
罒 д 罒在這個知乎網頁上能看到的字元,都是用UTF-8編碼的Unicode字元。
剛搜了一下,「?」原來是韓文中眼睛的意思,「?_?」還真形像啊。
- (??????) ?
- ( U+0028: 左括弧
- ? U+0e51: 泰文數字 1
- ? U+2022: 項目符號圓點,普通標點
- ?? U+0300: 重音符號,組合字元(合併在前方字元上方)
- ? U+3142: 韓語字元
- ? U+2022: 項目符號圓點,普通標點
- ?? U+0301: 重音符號,組合字元(合併在前方字元上方)
- ) U+0029: 右括弧
- U+0020: 空格
- ? U+2727: 空心四角星,符號
- ┳━┳ノ(°_°ノ)
- ┳ U+2533: 製表符
- ━ U+2501: 製表符
- ┳ U+2533: 製表符
- ノ U+30ce: 日語片假名
- ( U+0028: 左括弧
- ° U+00b0: 角度符號,非組合字元
- _ U+005f: 下劃線
- ° U+00b0: 角度符號,非組合字元
- ノ U+30ce: 日語片假名
- ) U+0029: 右括弧
- ?_?
- ? U+b208: 韓語字元
- _ U+005f: 下劃線
- ? U+b208: 韓語字元
- (′?皿?`)
- ( U+0028: 左括弧
- ′ U+00b4: 重音符號,非組合字元
- ? U+0b87: 泰米爾語字母
- 皿 U+76bf: 漢字
- ? U+0b87: 泰米爾語字母
- ` U+ff40: 全形重音符號,非組合字元
- ) U+0029: 右括弧
- (?ˉωˉ?)
- ( U+0028: 左括弧
- ? U+0e51: 泰文數字 1
- ˉ U+00af: 長音符號,非組合字元
- ω U+03c9: 希臘文小寫字母
- ˉ U+00af: 長音符號,非組合字元
- ? U+0e51: 泰文數字 1
- ) U+0029: 右括弧
- (???_????)
- ( U+0028: 左括弧
- ? U+0e51: 泰文數字 1
- ? U+2022: 項目符號圓點,普通標點
- ?? U+0e35: 泰文母音符號(合併在前方字元上方)
- _ U+005f: 下劃線
- ? U+0e40: 泰文母音符號
- ? U+2022: 項目符號圓點,普通標點
- ?? U+0e35: 泰文母音符號(合併在前方字元上方)
- ? U+0e51: 泰文數字 1
- ) U+0029: 右括弧
(??????) ?
- ?:泰文 數字 1
- ??:這個是組合文字和黑點的組合
- ?:諺文輔音 p
?_?
- ?:諺文音節 non
(′?皿?`)
- ?:泰米爾文母音 i
編碼應該是均為UTF-8。
阿拉伯語,例如……沒找著例子。
日語,例如 ̄へ ̄中的へ。
韓語,例如(?ò?ó?)中的?。
西里爾文,例如"(o Д o*)中的Д。
希臘語,例如(*°ω°*)?"中的ω。
還有拉丁字母,中文,藏語等等。
除此之外,還有很多特殊字元,可以在原字元的特定位置在添加符號,例如?( ?? ? ? ?)?中的 ?實際上是一個在原字元下方添加 ?的一個字元。在中文下也適用 ?。
最後補充幾句,其實你把顏文字複製到Word里,全選,按Alt+X可以得到編碼,通過編碼可以查到這個字元的名稱喲~
所以其實查到一個字元的具體名稱是很容易的。(?ˉωˉ?) 邀請我了?
等下看看這是什麼問題?「?_?」?
好看有點看不懂...Σ( ° △ °|||)︴
讓我想想...(~ ̄(OO) ̄)ブ
該怎麼說呢..o( ̄ヘ ̄o#)
不知道從何說起呢... ╥﹏╥...
還是先保存草稿吧?..o(*^▽^*)┛
總之就先這樣回答.. d=====( ̄▽ ̄*)b
這些顏文字以前是這樣的,比如笑::)
:D
:P
後來是這樣的: ̄︶ ̄
然後是這樣的:︿( ̄︶ ̄)︿
最後越來越複雜:
- ~( ̄▽ ̄~)(~ ̄▽ ̄)~
- ヾ(≧▽≦*)o
- *′?`)′?`)*′?`)*′?`)
用到的字元越來越複雜,已經需要動用各類軟鍵盤,使用各類的包括希臘、韓國、日本等國家的文字元,甚至還要加上一些製表符才能做到了。
- (* ̄rǒ ̄)
所以現在一般都直接自定義到碼錶中,普通的結合字詞作為候選。
比如:
O(∩_∩)O哈哈~ 這應該是搜狗用的最早的一批顏文字
但現在是這樣的:
(註:用雙拼,hj等於han,這個表情表示寒..)
一般不會再像「:)」 這麼簡單到可以直接用英文鍵盤直接打出來了。所以你大可搜索一些喜歡的顏文字,然後自定義編碼,放到輸入法中去。
- ヽ( ̄ω ̄( ̄ω ̄〃)ゝ 就醬紫,再見。
------------02252100補充---------------
被指責賣萌了。- o(TヘTo)
所以還是好說下,首先顏文字本來就是由字元構成的,所以原本是不存在編碼一說,比如最簡單的 @_@~ 或者更原始的 :(
如果你想以這種方式打更複雜的顏文字,比如 :┕( ̄Δ ̄)┒ 單純依靠鍵盤就不成了,需要用到軟鍵盤。其中┕┒ 是製表符,Δ可以在希臘字母中找到。
而在知乎上看到這個賤賤的顏文字更是複雜:( *?ω?)?╰ひ╯
其中的剪刀圖案的Unicode編號為U+2704,相同的圖案字元有:??????????????等等。ひ是日文字元。
那麼這些你會一一去單打字元輸出么?還是直接自定義一下短語,或者加入碼錶,給這些表情來個快捷輸出方式呢?
這種快捷自定義,即「編碼」。
(註:截圖來自搜狗網頁)
(註:截圖來自搜狗網頁)
添加顏表情詞庫之後,就可以通過打棒、爆笑等字詞的編碼得出顏文字的候選,實際上題主提到的訊飛也是這樣加入詞庫中以供候選的。
在這類輸入法的內部,其實就是bang=(??????) ?這樣映射。
另外可以通過碼錶定義來使用一些一些特別的,自創的,有意思的顏文字。比如剛剛那個剪JJ的表情,可以直接加入碼錶或者自定義短語即可。
比如(註:雙拼jmjiji等於jian ji ji)
(註:雙拼jmjiji等於jian ji ji)
這樣即可。用其他輸入法也可以,甚至更方便。另外注意排列一下候選序列,一般不要把顏文字弄到第一個。
漢字能組成很立體的顏文字,比如:
吃我魔貫光殺炮!!д?)σ弌弌弌弌弌弌弌弌弌弌?
凡是曲里拐彎的,就像從兜里拿出來的耳機那樣的符號,多數是南亞東南亞那邊的文字
凡是主要由橫線豎線組成的,一般是諺文
最右邊的筆畫是個豎,而且拖的長長的,多數是藏文梵文之流
最右邊的符號個頭高。後面跟著的符號個頭矮,就像一堆曲線,時不時點倆點的,那是阿拉伯波斯維吾爾的字母
就像各種小短棍兒擺成的文字是希伯萊字
豎著寫的像毛毛蟲那樣的一般都是蒙古字,滿文
新蒙古文用西里爾文,也就是俄羅斯用的那種有反過來寫的N
知乎的網頁用的是UTF-8編碼的Unicode字元。
你可以下載一個Unicode的字符集搜索一下具體每個字元是什麼來源。http://www.unicode.org/Public/7.0.0/charts/CodeCharts.pdf(話說一個不到100M的PDF包含了世界上所有的字元真是
搜狗輸入法的顏文字是按照UTF-16編碼的Unicode字元。
當題主將顏文字上屏到知乎時,實際上網頁已經對上屏的顏文字重新編碼,變成了知乎頁面遵循的UTF-8的編碼方式。
另外,如果大家對顏文字感興趣的話,可以到搜狗輸入法顏文字的活動頁下載顏文字包,也可以創建屬於自己的顏文字並上傳,具體的地址為:搜狗顏文字Unicode字符集,有若干種編碼
(→_→)人(^—^(( ←_← )
1998年,竇偉偉結合河圖洛書的傳說與世宗大王造字的故事,創製了真正意義上由多語言橫排符號組合的顏文字教學體系。多語言的文化包容性和字元多樣性,讓顏文字有了數以萬計的單行象形文字組合形式,並成為獨立於 ASCII art 和 JIS art 等多行符號擬圖藝術的亞文化現象,最終發展成為影響全球的世界文化符號。
最初,竇偉偉製作的多語言橫排符號組合中,以朝鮮語諺文字母為主,中日文字符集為輔。這種多語言橫排符號組合的表達方式,不僅個性而且好玩,吸引了許多人的關注。為了方便介紹這些多語言橫排符號組合,竇偉偉取「顏」字的諧音與含義,把這種多語言橫排符號組合稱為「顏文字」。顏文字教學體系的推出,是顏文字創製的里程碑性事件,使得顏文字通過外語學習社群得以快速傳播。
1999年,顏文字(kaomoji)的叫法在日語社群中也被固定下來。2000年之後,瀏覽器多語言支持逐漸成熟,顏文字在中國、日本、韓國等東亞地區廣為傳播。時至今日,顏文字作為亞洲網路流行文化的重要組成部分,已經成為一種超越語言的表達方式。
當前,中國已經成為世界上顏文字用戶最多的國家。顏文字以其獨特的魅力,成長為一種「萌」感十足的亞洲文化現象,極大豐富了世界互聯網文化的情感傳播。
在2000年之前,顏文字(kaomoji)在日本主要是指 JIS art 多行符號人臉擬圖藝術,並且JIS編碼方式不支持多語言字元顯示。實際上直到2002年,日文的平假名片假名字元在顏文字體系中佔比例仍然極低,甚至遠沒有泰語、阿拉伯語、敘利亞語字元的應用比例高(例:(????)??)。
在人類歷史上,偶爾使用類似顏文字元號的現象非常普遍。從中國史前文明石刻到近代書法都有顏文字化的雛形,這些類似的表現形式,在當代人的眼中很難被解釋為創作顏文字,更多是歸於石刻藝術和書法藝術。無獨有偶,從美國到日本,有人偶爾無聊,在電腦打出一些類似顏文字的電腦符號組合,之後自己都不再使用的現象,並不是真正意義上的製作顏文字。更不要說那些日本藝術家,通過採用 JIS art 創作方式,製做類似美國 ASCII art 多行符號模擬圖片藝術,本身就是獨立於顏文字之外的藝術形式。
日本電視、雜誌和報紙等主流媒體接受顏文字(kaomoji)比中國早,並且有一些顏文字周邊商家參與炒作,形成了顏文字起源於日本的假象。學了俄語之後,發現自己學了整套的顏文字素材(°Д°)Ъ
是 Unicode 來著,Unicode 也叫萬國碼,基本包含了所有國家的文字和符號
以前寫過 Unicode 的一個在線工具,可以根據文字查詢某個字元是哪個國家的文字
http://tool.yunser.com/unicode
Θ..Θ
希臘字母 Theta
顏文字證明了象形文字出現的合理性~
??*( ?o? )*°゜?°?(??? ? ???)??????????????????????????
顏文字只是幾個字元,跟編碼沒有任何關係。具體要在內存或硬碟中表示的時候,愛用 UTF-8 用 UTF-8,愛用 UTF-16 用 UTF-16。
??_??泰文,字面意思是「嘻嘻」中間橫線無意義
推薦閱讀:
TAG:輸入法 | Unicode(統一碼) | 字元編碼 | 冷知識 | 小語種 |