有沒有哪種語言只要稍微改動一下寫法就能讓翻譯引擎無法識別但是掌握該門語言的人閱讀起來還是沒有太多障礙?
如題。之所以問這個問題的原因之一是不想讓那些使用翻譯軟體的人讀懂。
用拉丁字母、西里爾字母等書寫的,只要把字母互相換成別的書寫系統的同形近形的字母就可以了。如:
Fοur ?сοrе аnd ?еvеn уеar? аgο our fаthеr? brοught fоrth оn th?? соnt?nеnt, а nеw nаt?οn, соnсеivеd in L?bеrtу, аnd dеd?cаtеd tо thе prоро??t?оn thаt аll mеn аrе сrеаtеd еquаl.說得跟真的似的。。。。
這樣做視覺上毫無損失。
不過用到ocr就完全繳械了。
更新:其實有一些語言,沒有設置障礙機翻本身jiuhen捉急了。像波斯語:像這裡,我好好的「Farsi」他硬是yaogei翻譯成「英語」……--------------------------------------------原答案:看到大家的回答,我也就來湊個熱鬧。結果發現,機翻還是too simple,就日語之內的假名轉換就夠了。大家看:
用其他書寫系統的形近字元,上面已經答得很好了。
給個現實的例子——沃拉普克編碼。
沃拉普克編碼與音譯在俄國剛剛連接到互聯網的時候都被使用。在早期互聯網上,收發電子郵件時受字體、輸入方式等限制,使用西里爾字母是相當困難的。一方面,如果輸入者沒有支持輸入西里爾字母的鍵盤或輸入法,就無法用西里爾字母輸入;另一方面,無論是收件人還是發件人,如果不使用同一種西里爾字母的編碼(計算機剛引入俄羅斯時有很多種不太完善又互不相通的文字編碼),那麼收發雙方看見的內容往往是大相徑庭的。另外,當時使用的7比特儲存一個字元的編碼阻礙了西里爾字母的引入。因此當時很多電子郵件用戶往往使用各種方法來表達原本用西里爾字母書寫的俄語信息,沃拉普克編碼正是其中一種方案。
一些俄羅斯電郵服務供應商甚至提供選項讓用戶能把從俄羅斯發出國外的郵件自動轉換為沃拉普克編碼再發出。
例子(比較長,剩下的自己點原頁面看吧):
А — A
Б — 6, bВ — BГ — F, rД — D, g (手寫體)Е — EЁ — E, E", ? (拉丁字母)Ж — *, }I{З — 3И — N, u (手寫體)
依葫蘆畫瓢,用拉丁字母的(如英語)也可以用希臘和西里爾字母來「調包」。你把"Hоw аrе уоu?"複製到有拼寫檢查的地方,保證每個單詞畫線,讓不知內情的人摸不著頭腦。
類似的,漢字雖然數量多,不一定每個字都找得到合適字元,但只要每隔幾個字換掉一個基本上就實現目的了。例如「衛」換成諺文的「?」,「工口」換成片假名「エロ」(大誤)什麼的。大不了還能寫成「氵又字」這種。
如果真的有心,也可以給每個字都找到形近字代替,例如:
U+830D U+233C0 U+56EF U+51A2 U+738D U+21585 U+4ECE
U+21E08 U+56DA U+256D4 U+8914 U+2856E U+47A4 U+5EF4
(擴展漢字知乎不支持,都改成Unicode了)
著名的歐盟笑話,英語轉偽德語:
The European Commission has just announced an agreement whereby English will be the official language of the European Union rather than German, which was the other possibility.
As part of the negotiations, the British Government conceded that English spelling had some room for improvement and has accepted a 5- year phase-in plan that would become known as "Euro-English".
In the first year, "s" will replace the soft "c". Sertainly, this will make the sivil servants jump with joy. The hard "c" will be dropped in favour of "k". This should klear up konfusion, and keyboards kan have one less letter. There will be growing publik enthusiasm in the sekond year when the troublesome "ph" will be replaced with "f". This will make words like fotograf 20% shorter.
In the 3rd year, publik akseptanse of the new spelling kan be expekted to reach the stage where more komplikated changes are possible.
Governments will enkourage the removal of double letters which have always ben a deterent to akurate speling.
Also, al wil agre that the horibl mes of the silent "e" in the languag is disgrasful and it should go away.
By the 4th yer people wil be reseptiv to steps such as replasing "th" with "z" and "w" with "v".
During ze fifz yer, ze unesesary "o" kan be dropd from vords kontaining "ou" and after ziz fifz yer, ve vil hav a reil sensi bl riten styl.
Zer vil be no mor trubl or difikultis and evrivun vil find it ezi tu understand ech oza. Ze drem of a united urop vil finali kum tru.
Und efter ze fifz yer, ve vil al be speking German like zey vunted in ze forst plas.
其中最後一段,百毒翻譯(手機谷歌不容易)檢測為丹麥語(什麼鬼)
按英語翻譯:
和繼澤fifz是的,我喜歡他們能力VIL鋁是德國vunted澤第一軍。
按德語翻譯:
在fifz yer澤和VE的Al的VIL speking英語Ⅱvunted澤林樣改變。
按丹麥語翻譯:
和澤fifz Y後,VC會像任何speking德國在第一zey vunted澤坤新材料。
都是什麼鬼
其實按照上面的規則一步步回溯,可以得到原本「正常」的英語是這樣:
And after the fifth year, we will all be speaking German like they wanted in the first place.
百毒也能正常的翻譯:
第五年後,我們都會像他們想要的那樣說德語。
英語可以偽裝成假的德語(類似火星文一樣的感覺
比如
Four score Anne seven years ago our V?ter brought forth on Zis continent, Eh neu nation, conceived in liberty, Anne dedicated zu Das proposition thaht alle M?nner are created equal.
或者日推上玩地很 high 的偽中國語
例:君中國語本當上手
全漢字日本人中國人理解可能性有
(逃
日語。有漢字就是好玩。
之前就流行過的偽中國語。現在在推特上藉助碧藍航線的大火開始重新流行了。
明明是日語,但是去掉了假名,必須熟練掌握日語才能看懂。或者中文母語,才能強行看懂一點。翻譯軟體直接吃癟,想都不用想。全都在射爆和謝謝茄子。別笑,以後中國人和日本人只要稍微學習一些門道就可以用偽中國語和偽日本語互相交流了。
今時射爆、中國日本両國御宅交流重要言葉。
皆喜、天晴、天晴。碧藍航線未來日中関係架橋、此重要。一般人皆使用可能希望。実現時日中平和。皆全員射爆、紛爭無、世界平和。完全可以啊,比如像醬:
Ι υsεδ τo бε αη αδνεητυгεг lιкε уου, τhεη Ι τoοк αη αггoω ιη μу кηεε...[已改](好像暴露了什麼.JPG)大概這就是英文版的火星文吧。。。。。。【逃或者像我們當年上學的時候玩的那樣:
-кань ю спик инглиш?-koneshno!有什麼區別的話大概就是第一個是安X希味的英語後一個是X斯利安味的英語吧。。。(?&>ω&<*?)日語呀,只要熟用各種縮略口語、方言、語尾助詞、文化梗等等,翻譯軟體真的沒轍。
我們來設計一個場景:
你是一名高中生,喜歡上了年級里一個打扮時髦艷麗的女生。然而這個女生有好多不太好的風評,作為朋友的我苦言規勸,但你還是被初戀的心動沖昏了頭腦,想在文化祭的時候跟她表白。於是我們幾個人就幫你準備了一場戲,讓你在文化祭的才藝表演上大出風頭,然後你就帶著勝者的光環,在傍晚的天台上,跟那個女生表白了。
以下內容來自於當晚你和我的line聊天內容:
這句話里其實完全沒有方言,用到的幾個詞的含義是:
つーか:ていうか(這麼說來)的口語說法
シカト:俚語,意思是置之不理,無視
ムカ:ムカつく的簡化說法,意思是令人生氣
ひでぇ:ひどい(惡毒的)的口語說法
這句話原意是:所以她完全不理你?真他媽讓人生氣,裝什麼裝啊那個賤人
然而google翻譯的結果卻有幾分可愛呢。
百度在線翻譯得更有意思:
直接把不懂的詞留下來,留下來啊!
答主@曹潔萍提到的下面這段話
Fοur ?сοrе аnd ?еvеn уеar? аgο our fаthеr? brοught fоrth оn th?? соnt?nеnt, а nеw nаt?οn, соnсеivеd in L?bеrtу, аnd dеd?cаtеd tо thе prоро??t?оn thаt аll mеn аrе сrеаtеd еquаl.
我把它的讀音根據其他語言的拼讀規則進行改寫
荷蘭語
Voor scoor end sewen jiers ago our faazers broot vors on zis kontienent, a nieuw nation, konsiewdt in liberty, end dedikijtidt toe ze propozition zat oll men aar krijtid iequal.
丹麥/挪威/冰島語混合
Vor sk?l ?nd seven j?rs agó aur faeersebroht vort on eis kontinent, a ny n?sjon, konsívd in liberty, ?nd dedikejtid tu ee propozisjon e?t ?ll men a kriejtid íku?l.波蘭語
For ?kor ?d sew? jrz ago? a?r faser? brot foz ? chysz kond?ynent, a ny? naszoń, kond?ywd in libyrty, ?d ded?ykejtyd t? zy propor?yszoń rzat ol m? a krjeytyd ik?al匈牙利語
Far szkar end szeven y?sz ?go aur fázár brot forsz an hisz kantinent, a nju nesan, kensivd in liberti, end dediketid tu z? prapr?zisan zat al men a krietid ikual芬蘭語(這個其實和英語發音出入很大了,因為芬蘭語幾乎全是開音節)
Fooru s?koo ?nde sevena iirisa ?goo auure faas?r burote ?na hisa kantinente, ? nüü n??sjoni konsiiveda ine liiberati, ?nde dedik??tido tuu s? purop?zisjone z?ta ale mene a kuriitida ikuvaala上面有的發音和英語存在出入是因為我想讓它看起來or聽起來更具有對應語言的特點 一般情況下只會英語的人按照英語的發音規則念上一兩遍 都是可以理解的
用德語正字法寫英語
The European Commission has just announced an agreement whereby English will b
e the official language of the European nation rather than German which was the other possibility. As part of the negotiations, Her Majesty"s Government conceded that English spelling had some room for improvement and has accepted a 5-year phase-in plan that would become known as "Euro-English". In the first year, "s" will replace the soft "c". Sertainly, this will make the sivil servants jump with joy. The hard "c" will be dropped in favour of the "k". This should klear up konfusion, and keyboards kan have one less letter. There will be growing publik enthusiasm in the sekond year when the troublesome "ph" will be replaced with the "f". This will make words like fotograf 20% shorter. In the 3rd year, publik akseptanse of the new spelling kan be expekted to reach the stage where more komplikated changes are possible. Governments will enkourage the removal of double letters which have always ben a deterent to akurate speling. Also, al wil agre that the horibl mes of the silent "e" in the languag is disgrasful and it should go away. By the 4th yer peopl wil be reseptiv to steps such as replasing "th" with "z" and "w" with "v". During ze fifz yer, ze unesesary "o" kan be dropd from vords kontaining "ou" and after ziz fifz yer, ve vil hav a reil sensibl riten styl. Zer vil be no mor trubl or difikultis and evrivun vil find it ezi tu understand ech oza. Ze drem of a united urop vil finali kum tru. If zis mad yu smil, pleas pas it on to oza pepl.
最後一句話用谷歌翻譯:
如果你瘋了,你就笑,請把它交給Oza pepl。
更新新版v0.3,加上了字典功能:
左邊上面的框填被替換字元,下面的框填替換字元。同一個字元出現多個替換時隨機選擇。
下面是評論區 @荊哲 要的棕狐狸效果,上下填上對應文本即可:
原回答:
受到 @王贇 Maigo 的啟發,我寫了一個小程序來把英文字母替換成「長得像」的字母。
效果如下:
選一小段看看:
Now we are engaged in a great civil war, testing whether that nation, or any nation so conceived and so dedicated, can long endure.We are met on a great battle - field of that war.We have come to dedicate a portion of that field, as a final resting place for those who here gave their lives that that nation might live. It is altogether fitting and proper that we should do this.
處理後:
?ów w? ?r? ?ń????d íń ? ?r??t ?ívíl w?r, t??tíń? w??t??r t??t ń?tíóń, ór ?ńy ń?tíóń ?ó ?óń??ív?d ?ńd ?ó d?dí??t?d, ??ń lóń? ?ńdur?.W? ?r? m?t óń ? ?r??t ??ttl? - fí?ld óf t??t w?r.W? ??v? ?óm? tó d?dí??t? ? pórtíóń óf t??t fí?ld, ?? ? fíń?l r??tíń? pl??? fór t?ó?? w?ó ??r? ??v? t??ír lív?? t??t t??t ń?tíóń mí??t lív?. It í? ?ltó??t??r fíttíń? ?ńd próp?r t??t w? ??óuld dó t?í?.
連我都看得懂……感覺不切題了,不是「沒有太多障礙」,感覺根本就是沒有障礙嘛。
弄到谷歌翻譯試試:
庫爾德語?最後一堆oooo是什麼鬼?
應該達到目的了吧~
Latin2MarsLang v0.3版exe程序:
http://pan.baidu.com/s/1gfQup6z
程序圖標懶得弄了。源碼也懶得傳github了,就一個map轉string而已。
最後,誰能告訴我,為什麼知乎傳的圖片壓縮得這麼丑?為什麼你們的圖那麼清晰,我傳的被壓成這個鬼樣?
跟著 @王贇 Maigo 大佬來的,本來關注的是代碼程序方面,結果 tl 每天被語言類問題洗刷,,,大佬是真的強。申明下,我對語言語音這個領域完全外行,所以不知道下面說的對不對。
比如說,對照吳語地區的發音,把應的中文漢字寫出來,應該能秒掉一大片,例如:泥今遭喲豆油控非啦 ---&> 你今晚有空嗎?
稍微跑個題
愛-same-CRIER
愛撫-save-LIAREid-聖-Rising HELL愛してる Game世界のDayDon"t-生-WarLie-兵士-War-WorldEyes-Hate-WarA-Z Looser-Krankheit was IS das?
?t?k 0N t??tn
凸】♀】♂】
SiTE-n0w1
BRE@TH//LESS
Deerン怒過多6-$
克JOU気MACHINE甲
音:9RE:eita-zu
β?ο?
Rё?L
Vぉ1℃→Ki母∪
I←Na←Ra←Ke←Ha←Ki←Se←No←E←Ma
k:100%‐:0%
[@$αM?]
nf壱III
犬Kあ3L
aズ-17歩
廣2tree02 ネ日|-血
z10b2r0i1e2f0i9n1g3
z30huri2ba0tt12le1110
pfSOTEad3
我不覺得正常人類能一眼看懂……除非你姓[Θ????Θ]里予
參考資料:
TVアニメ「アルドノア?ゼロ」ED2) - mizuki/SawanoHiroyuki[nZk] - 單曲 - 網易雲音樂
澤野弘之 - 萌娘百科 萬物皆可萌的百科全書
【nZk】#鍵盤# 澤野弘之OST曲名解析專樓
把拉丁字母a c e o p x改成長得一樣的西里爾字母
印尼語和馬來語啊,有時候我打馬來語的辭彙,結果谷歌翻譯就說來自印尼語,我艹。把一篇馬來語文章的kerana換成karena,谷歌翻譯就顯示來自印尼語了。雖然印尼語和馬來語很接近,但有的差別挺大的,比如ibu negara在馬來語是首都,印尼語是國母。seronok在馬來語是高興,在印尼語是淫蕩地笑。kereta在馬來語是汽車,在印尼語里是火車。comel在馬來語是可愛,在印尼語是美麗。
蠻有趣的問題。看了那麼多的回答,都是在舉例子,我想從語言學的角度來仔細思考一下這個問題。
有的人說,把語言中的某些字或字元替換掉。比如使用希臘字母代替英文字母。我想說,這樣的話是不能解決問題的啊,只要計算機程序稍微一修改,比如把長得像A的字元全都當做A來識別,一下就解決掉這個問題了啊。
那如何才能真正做到只有人才能看懂而機器看不懂呢?
一種方式是利用讀音。
先說當今的翻譯引擎都是如何翻譯的,也就是機翻的基本原理。現如今大多數機器翻譯還是主要依靠雙語詞典來進行識別和翻譯,機器知道每個單獨的詞或者片語的意思,再來揣測整句話的意思。這裡不展開說了,但是最重要的一點是:機器翻譯是不涉及讀音的。
這樣就提供了一個思路,只要按照讀音修改即可,也就是說相同讀音而不同寫法,而且不能被計算機總結出規律。比如有人說把ph變成f,把c變成k,只要固定了規律,人能記住,計算機也能學。這樣必然是不行的。
而汝果,中聞丸全用一歇相銅或向進的字萊抒寫的話,就丸全不是問提。
除非機翻以後改變演算法,不光識別文字的意思,還找出它所有的同音、相近讀音的字。但是這工程量就太大了而且太多種可能性了錯誤率一定暴高。
順便說一下,
這世界上很多語言都是表音語言,其中程度不一。比如韓語幾乎是完全的表音語言,而中文多數的字都與其讀音無關。韓語要想做到這一點,理論上來說,就會比中文要難。
另一種方式是利用字形咯,
但仍然,不能被計算機總結出規律,比如即便是把中文寫成這 木羊 白勺 訁舌,調整一下程序,還是能被識別出來的,英文換希臘字母同理。
除非就是到火星文那一種程度,讓電腦沒法predict, 但是不是所有文字都可以這麼玩的。
還有,其實隨意改變語序其實是一個好辦法,但要注意的是,這樣的話,其實對於中文這樣的語言是不利的,對於英文那種有長單詞的語言反而比較有利。
另外,我這個回答是在翻譯軟體有可能改進演算法的前提下寫的。如果只是現在的翻譯軟體這種程度的話,隨便打幾,個逗,號空,格就翻譯不出來了。
可以說是最近在韓國很火的一種造字方法了當然也可以說是一種流行語,就是用類似的音替換或者類似的字形來替換,但是都能看懂,比如:???-???.(手寫的時候前後兩個類似)甚至還有隻取單詞輔音的,比如最近十分火的??? ? ??~~最後配上一張神圖,裡面有所有各種換法,有沒有小夥伴知道說的是啥 我反正笑了半天
呃,空格和前/後一位對換位置怎麼樣?
像是:Whoi sy ourd addya ndw hatd oesh ed o?Wh oi syou rdadd yan dwha tdoe sh edo?不行就混著來,奇數空格怎麼跳偶數就反過來:Nok in grulesf oreve, rmys on.針對漢字的話,試試奇偶數對換可好……
要你道知,字漢順的不序定一響影讀閱。
么那,能你懂看在我什說嗎么?
雖然還可以升級成321654或231564什麼的,我懶但繼續得殘人摧了腦,且這而一看么井冰深樣的一「嘻嘻嘻嘻嘻嘻」謂百可不侵毒……
最切合題意的難道不是漢字么,加減筆畫偏旁。
只要用火星文就可以了。
雖然理論上電腦可以識別並翻譯火星文,但一般的翻譯軟體開發者不會屑於去做。
(參見:非主流火星文理論上能被電腦識別並翻譯嗎?)
而火星文是各種語言都可以有的。對於有些語言,火星文弄起來甚至比漢語更加簡單。比如對於英語,把其中一些字母換成形狀相同或相近的俄語、希臘語字母,就可以騙過各種機器翻譯系統,但人眼閱讀起來毫無障礙。
推薦閱讀: