如何快速分辨一串西里爾字母是那種語言?


主要是看一些特殊字母及高頻詞。基本上所有用西里爾文字的語言,都有自己的一些獨特字母或正字特點。

我記得很久以前,有位朋友發來一個「俄文」文檔,讓幫忙翻譯,結果打開一看,除了個把詞之外,什麼都不懂,而且有很多沒見過的西里爾字母。後來接觸了一些突厥語,結合其他一些信息回想了一下才明白,那應該是韃靼語。

用西里爾字母的語言,林林總總,三十多種是有的。但是很多語言很小,比如俄聯邦境內的少數民族等等,國內基本接觸不到。使用人口比較多的那些語言,還是比較好區分的——

一、斯拉夫語

如果你懂俄語,讀某段文字發現有不少動詞、形容詞、介詞、連詞似曾相識(靠名詞判斷不太靠譜),那麼這99%是斯拉夫語族的語言。

練習一:判斷下面兩段話,哪段是斯拉夫語

Мандатар Александар Вучи? поручио ?е, представ?а?у?и кандидате за министре у ново? влади, да веру?е да ?е изабрао тим ко?и ?е бити спреман да оствари све зацртане ци?еве и победе.

Москва хотод оршин суугаа Монгол улсын гавьяат ж?жигчин, Оросын 「Ардын ж?жигчин」 уралдааны ялагч, оросын 「Премьер-министр」 хамтлагийн гоцлол дуучин Борх??гийн Амаарх??г та б?хэнд тусгайлан танилцуулах нь ил??ц биз ээ.

# 答案:第一段是。поручио、веру?е、изабрао 這些動詞和俄語很像,另有 ново? 等很基礎的形容詞和俄語類似。這是塞爾維亞語。第二段為蒙古語。

1. 俄語。略。

2. 烏克蘭語。字母?、?和?是特徵。不過?在蘇聯時代的出版物里沒有。

3. 白俄羅斯語。同樣有字母?,不過有一個戴帽子的у是其特徵:?。只要是有?的斯拉夫語,一定是白俄羅斯語。

練習二:判斷哪段是白俄羅斯語,哪段是烏克蘭語。

"МЗС ма? орган?зувати телефонн? розмови з кер?вництвом Н?меччини та Франц?? у трьохсторонньому Нормандському формат?, запросити розмови з в?це-президентом США, президентом ?вропейсько? Ради Дональдом Туском та ?н?ц?ювати розмову з президентом РФ Пут?ним", - сказано в пов?домленн?.

Учора заснавальн?к Незалежнага ?нстытуту сацыяльна-эканам?чных ? пал?тычных дасьледаваньня? (Н?СЭПД) Алег Манае? заяв??, што Н?СЭПД згортвае сваю працу ? Беларус? з-за ц?ску ?лада?.

# 答案:送分題,略。

4. 塞爾維亞語。有字母?、?、?、?、?、?。黑山語新正字法也有這些字母,不過國內應該很少能碰到西里爾文黑山語的東西(很多黑山人也不用這個蛋疼的東東)。黑山語的西里爾字母比塞爾維亞的多一些特殊字母,不過這裡就不細說了,因為這倆實際上是一種語言的不同變體而已。

5. 馬其頓語。和塞爾維亞語也有?、?、?、?,但沒有?、?,比塞爾維亞語多了頭上長角的?、?、?。此外,如果你看到和俄語類似的名詞/形容詞,但是單詞結尾多了個-от、-та、-то、-те之類的帶個т的音節,那麼這是馬其頓語或保加利亞語的後置定冠詞,是在斯拉夫語中很奇葩的存在,可以幫助判斷。

6. 保加利亞語。沒有?這樣的特殊字母,字母都在俄語字母表裡,俄語字母表之外的字母一律沒有。此外,保加利亞語用ъ比較多,因為在保加利亞語里ъ不是硬音符而是個母音字母,比如保加利亞的國名就是България。

練習三:下面三段文字中,一段是塞爾維亞語,一段是馬其頓語,一段是保加利亞語,請判斷。

Летни олимписки игри (ЛОИ) — ме?ународен пове?еспортски настан првпат одржан во 1896 година, ко? се приредува на секои четири години од страна на Ме?ународниот олимписки комитет.

Лет?е олимпи?ске игре ме?ународни су мултиспортски дога?а? ко?и се одржава сваке четири године, у организаци?и Ме?ународног олимпи?ског комитета.

Летните олимпийски игри са най-голямото международно спортно събитие, в което спортисти от цял свят се състезават в различни спортове. Провеждат се на всеки 4 години.

# 答案:依次是馬其頓、塞爾維亞、保加利亞。състезават、събитие 中的ъ就是保加利亞語的那個特殊母音。Ме?ународниот олимписки комитет 中的 -от 就是馬其頓語和保加利亞語的那個後置定冠詞。

二、非斯拉夫語

在國內能接觸到的用西里爾字母的非斯拉夫語主要是中亞那些斯坦的國語以及西里爾蒙古語。偶爾可能見到老亞塞拜然文和現在俄聯邦用的韃靼文、巴什基爾文。我就不按語言說了,只說幾條判斷標準。

標準1:有沒有母音字母?、?和小尾巴的輔音字母?,如果有,則是印歐語系伊朗語族的塔吉克語。

標準2:觀察有沒有母音字母?、?,如果有,那麼恭喜,歡迎來到阿爾泰語系的地盤。有這兩個字母的語言有蒙古語族的蒙古語和突厥語族的哈薩克語、吉爾吉斯語、巴什基爾語、韃靼語、土庫曼語(蘇聯時代老文字)、亞塞拜然語(老文字)。烏茲別克語老文字是個例外,沒有?和?,但有一個標誌性的字母?,非常好認。

練習四:區分塔吉克語和阿爾泰語系的語言。

(1) Б?тенд?нья татар яшьл?рене? VII форумныны? пленар утырышында туган телне ?йр?н?, аны? куллану м?хитен ки???йт? турында к?ренекле м?гъриф?т белгече Рашат Якупов чыгыш ясап, тел м?сь?л?сене? катлаулы ??м актуаль якларын тасвирлады.

(2) Забони то?ик? ди??ати бисёр олимон ва нависандагони оламро ба худ ?алб кардааст. Ба ом?зиши забони порс?-то?ик? яке аз асосгузорони коммунизми илм? Фридрих Энгелс низ маро? зо?ир карда буд. Забони то?ик? р?з то р?з рушд мекунад ва сад?о вожа?ои нав ба таркиби лу?авии забони он ворид мешаванд.

(3) Амгы ?еде салгалдар аразында харылзаа дыка-ла ырап, улуг улус-биле ажы-т?л?н?? аразында харылзаазы дыка-ла чидип бар чыдар. Уруглары-биле кады бир-ле ч?вени кылып, сеткилинден чугаалажыр ?е к??г?с эвээжээн.

(4)Чорабин? бо ташаббуси ?укумати То?икистон дар як?ояг? бо СММ оид ба масъала?ои и?тисод? ва и?тимо? ташкил карда шудааст. Симпозиум бо дастгирии барнома?ои рушди СММ, СА?А, Бонки умуми?а?он? ва дигар ташкилот?ои байналмиллал? ва минта?ав? баргузор гардид.

# 答案:(1)(3)分別是阿爾泰語系突厥語族的韃靼語和圖瓦語(咦,這可能超綱了),(2)(4)是塔吉克語。

具體怎麼區分這些阿爾泰語言,可以補充看一些特徵來判斷——

標準2.1:如果字母?這個帶小尾巴的к。那麼是哈薩克語或烏茲別克語老文字之一。塔吉克語也有這個字母,但判斷是不是塔吉克語參考標準1就夠了。這個字母在哈薩克語和烏茲別克語出現超級頻繁。烏茲別克有帶尾巴的?和帶帽子的?,這是哈薩克語沒有的。

標準2.2:如果有字母?或?,則是哈薩克語。

標準2.3:如果有字母?,則是烏茲別克語。(也有可能是烏茲別克的卡拉卡爾帕克語,不過我認為通常碰不到,而且現在卡拉卡爾帕克語多用拉丁字母書寫了。)

練習五:區分哈薩克語、塔吉克語、烏茲別克語

Мунтахаби Русия бо 728 хол чун пешин дар зинаи 38-ум бо?? мондааст. Мунтахаби Исландия, ки дар чемпионати Аврупо-2016, дар Фаронса, ?амаро дар ?айрат гузошта буд бо 871 хол аз ма?оми 22 ба ?ои 23 поён рафтааст.

Ол 200 метр ?ашы?ты?ты брасс ?д?с?мен ж?з?п ?туде финал?ан шы??ан ед?. Баландин 2:07.46 уа?ыт н?тижес?мен финалда сенсация жасап, ?аза?стан тарихында ж?зу спортынан т???ыш рет Олимпиада чемпионы атанып отыр.

Биро? милиция оператив маълумотларида жиноятчилик энг ю?ори даражада б?лган деб ?айд этилган Тошкент туманлари биридаги манбаънинг айтишича, ?тган июл ойининг ?зида ози?-ов?ат ёки дору-дармон ??ирлашни амалга оширмо?чи б?лган 12 фу?аро ушланилган.

# 答案:分別是塔吉克、哈薩克和烏茲別克。

標準2.4:有一個母音字母連寫兩遍,比如уу、??、оо等,那麼這是吉爾吉斯語或蒙古語的長母音。蒙古語的長母音比吉爾吉斯語要多,而且蒙古語的字母э出現頻率也極高,另常常有小詞юм、нь、ч、л,可以用來判斷。

練習六:區分蒙古語和吉爾吉斯語

Америк-Австралийн эрдэмтэд Дэлхийн эр??л мэндийн байгууллагаас таван ?вчний эрсдэлийг бууруулдаг гэх биеийн ачааллыг заасан з?вл?мж нь худал болохыг батлав.

1930-жылдардын аягына, каардуу фракциялык к?р?шт?н кийин Сталиндин жактоочулары башкаруучу партиянын б?тк?л т?з?л?шт?р?н ?з?н? баш ийдиришет. Мамлекетте талаптуулук менен борборлоштурулган, тоталитаритардуу коомдук т?з?м т?з?л?т.

# 答案:上面是蒙古,下面是吉爾吉斯。

標準2.5:母音字母有?,輔音字母有?、?,這些字母都齊全,那麼這是哈薩克、韃靼、巴什基爾這三種欽察語支的突厥語之一。這三種欽察語中,如果冒出了?、?、?則是巴什基爾語,如果有母音?、?那麼是哈薩克語,如果有?則是韃靼語。

練習七:區分三種欽察語

?Таж ?ф?г? юлланды! Баш?ортостан, бе? и? я?шылары! Ф?йзи ??ск?ров исеменд?ге ансамблг? ??м ?Ар?ыма?? этно-т?рк?м?н? яр?амдары ?с?н ?ур р?хм?т!?, — тип я??ы Мил??ш?.

Бу виноград, цитрус ?ил?к-?имешл?ре ??м помидорлар кебек авыл ху?алыгы экспортыны? шактый ?сешен? китер?ч?к, диел? "Анадолу" м?гъл?мат агентлыгы сайтында.

Я?ни отбасын ??рамын деп, ажал ??ш?ан ж?г?тт?? туыстары нау?ас ?ыз?а жасалатын ота мен д?р?-д?рмект?? шы?ынын мойындарына ал?ан. Т?пт? ?ыз ая?ынан т?р?анша, ?олдан келгенн?? б?р?н жасаймыз депт?.

# 答案:分別是巴什基爾、韃靼、哈薩克。

標準2.6:碰到字母?、?,不是屏幕髒了,而是亞塞拜然語。此外,句子常常以-б結尾,這在其他突厥語不常見,因為突厥語的-p/b類副動詞一般需要和其他動詞連用或在劇中做中頓,不用來結束句子(當然這實際上是-p副動詞後的第三人稱詞尾丟掉了,變成了?,也就是維吾爾語里的okup-tu,bolup-tu在亞塞拜然語里對應的是okub-?,olub-?)。比如:

Телман С?ди о?лу ??ф?ров адлы аз?рба??анлы мина?а д?ш?р?к ??лак олуб. Бу бар?д? м?луматы Укра?на Аз?рба??анлыларынын Бирл?шмиш Диаспорунун с?дри ?икм?т ?авадов де?иб.

標準2.7:但看字母很難判斷土庫曼語老文字,因為和其他突厥語相比沒有什麼特殊字元,所幸的是土庫曼的文字拉丁化很徹底,現在基本沒有什麼人再用西里爾土庫曼文了。但如果你看到一種突厥語有連詞ве(「和」,相當於俄語и),那麼這應該就是土庫曼語了。

----------------

終極測試:說出下面文字的語言

(1) Б?г?н Астана уа?ытымен та??ы 7-де суда ж?зуш? Дмитрий Баландин Рио-де-Жанейрода?ы Олимпиада ойындарында алтын медаль же??п алып, спортты? б?л т?р?ндег? т???ыш ?аза?станды? чемпион атанды деп хабарлайды ?азА?парат.

(2) Маалыматка ылайык, бул айтыш "Тарых жана маданият」 жылына, II Д?йн?л?к К?чм?нд?р оюндарына, эгеменд??л?кт?н 25 жылдыгына жана "Айтыш" коомдук фондусунун 15 жылдыгына арналат.

(3) Скульптура гродзенскага кашталяна можа з"яв?цца на скрыжаваннях вул?ц Замкавай ? Гарадзенскага, Горкага ? 17 верасня, а таксама на плошчы Савецкай (на месцы сонечнага гадз?н?ка, як? перанясуць у ?ншае месца). Як менав?та будзе выглядаць статуя, вырашыцца ? ходзе адкрытага конкурсу, як? абвесцяць у хутк?м часе пасля заканчэння галасавання.

(4) Фильм яздырылган кассета кулдан-кулга й?реп, бернич? кеше карагач, мин аны Казандагы яшь тамашачылар театры ?ит?кчесе Ф?рит Х?бибуллинга бирг?н идем. Милли х?р?к?тт? катнашкан ??м ?леге программага да кертелг?н Ф?рит ?ф?нде, кызганычка, вафат булды. Шунлыктан кассетаны табу, кире кайтарып алу м?мкин булмады. Бары тик узган елда гына Германияд? яш??че к?ренекле милл?тт?шебез, 「Азатлык」 радиосыны? элекке директоры Ф?рит Иделле бу фильм яздырылган лазер т?линк?сен Казанга ?иб?рде. ??м х?зер, фильмны т?шер?д?н со? 25 ел ?тк?ч, аны татар тамашасылары карый ала. Х?ерле с?гатьт?!

(5) Чойбалсангийн намтар бол ХХ зууны эхний хагасын Монголын замнал, ялангуяа улс т?рийн амьдралын тусгал юм. Энэ бол Монголын т??хэн дэх магадг?й хамгийн ээдрээт ?е. Ээдрээтэй т??хийг б?тээлцсэн, басх?? хувь хувьсгалын намтар нь т??нийхээ ?ндэс нахиа, ?р дагавар болсон х?ний цадиг шастирыг улст?р-нийгмийн амьдралаас тусгайлан ?г??лэх аргаг?й.

(6) Одлука Хашког трибунала да поко?ног Слободана Милошеви?а, бившег председника Срби?е и ?угослави?е, ослободи свих оптужби за ратне злочине наводно почи?ене током рата у Босни, поново доказу?е да би све тврд?е НАТО-а о такозваним ?званичним непри?ате?има「 требало прихватати не с великом, ве? с огромном резервом.

(7) Шайх М?со Адман? – имоми Донишго?и Метрополитани Лондон, маркази Бритониё, дар як давраи ом?зиш? ба р??ониёни то?ик ро??ои ?илавгир? аз ифротгароиро масли?ат дод. Адман? бо даъвати Созмони амнияту ?амкор? дар Аврупо ба Душанбе омадааст ва дар с??бати ? бо р??ониён намояндагони додситон? ва созмон?ои и?тимо? низ ?узур доштанд.

(8) Оценявам високо професионализма на колегите си от Българската народна банка, които осигуриха спокойно и адекватно провеждане на тази изключително сложна процедура в съответствие с установената европейска практика. Така българската държава изпълни стриктно препоръките на Европейската комисия. Уверен съм, че освен реализирането на партньорския ангажимент, с приключилата процедура правим поредна сериозна стъпка към укрепването на банковия надзор в България, осигуряване на прозрачност и поддържане стабилността на банковата система и защита интересите на вложителите.

(9) Ганс-?еорг ?адамер — н?мецький ф?лософ, один ?з найзначн?ших мислител?в друго? половини ХХ ст., в?домий передус?м як засновник ?ф?лософсько? герменевтики?. Вивчав ф?лософ?ю, ?стор?ю, теор?ю л?тератури, ?стор?ю мистецтв та ?вангельську теолог?ю у ун?верситетах Бреслау та Марбурга. У 1922 роц? захистив докторську дисертац?ю п?д кер?вництвом Пауля Наторпа.

(10) Биз хато й??? демаяпмиз. Хатолар бор? масалан? ташкилотнинг т?ртта протоколи нот??ри т?лдирилган. Аммо бу а?амиятсиз камчиликлар ва уларни ?ал этувчи деб атаб б?лмайди! Улар оддий ёзувдаги техник хатолар ва миллионлаб инсонлар ?у?у?ларини ?имоя ?илувчи ташкилотни й?? ?илиб ташлашга мутла?о асос б?ла олмайди, деди ?у?у? фаоли.

# 答案:(1)哈薩克;(2)吉爾吉斯;(3)白俄羅斯;(4)韃靼;(5)蒙古;(6)塞爾維亞;(7)塔吉克;(8)保加利亞;(9)烏克蘭;(10)烏茲別克。


頻繁出現長母音的(拼寫上體現為母音連續出現)的多半是蒙古語。

西里爾蒙文母音有 а о у э и ? ? 等字母。


烏克蘭語有i,俄語沒有。有典型的形容詞詞尾ий ой等等(音同,字形不一定)是斯拉夫語族,包括但並不限於斯拉夫字母,你看波蘭語也能看出點相似點,並且排除了蒙語和斯拉夫字母書寫的突厥語。有人民幣符號¥的可能是哈薩克,蒙語和其他斯坦語我不了解。


google translate...親測樓上成功率80%...


看字母和辭彙、句法以及一些音譯詞的原語義。

哈薩克、蒙古、俄羅斯、烏克蘭、吉爾吉斯,寫出來的都很像俄語字母,懂這幾門語言的話,一眼就看得出來。


有一個網站里的文章會教你如何區分各國各語言使用的西里爾字母有何不同。

https://en.m.wikipedia.org/wiki/Cyrillic_alphabets

因為有許多前蘇聯國家及外蒙古都使用西里爾字母,在朋友給你看那些文字時你也許還會看到突厥語系語言的文字。

………………分割線………………

如下圖所示,下文中的西里爾字母是哈薩克文。哈薩克文有42個字母,包括俄語的33個。

很多突厥語系語言都有母音和諧律。

比如,哈薩克國歌里的一句:Ежелден ер деген.

吉爾吉斯語:Илимий изилд?? тармагы

而蒙古語打出來就像亂碼了一樣:Би том Монголд хайртай, Улаанбаатарт х?м??с маш их дуртай байдаг. Тал хээр, х?х тэнгэр, цагаан ??л ?рг?н х?м??сийн сэтгэлийг тайвшруулж чадна.

題主可以研究一下使用這些字母的國家,畢竟哈薩克、吉爾吉斯斯坦說俄語的人還是很多的。


還有一種特殊情況:偽西里爾字母。

詳情請參見wiki:

偽西里爾字母(英語:faux Cyrillicpseudo-Cyrillic),或稱偽俄文faux Russianpseudo-Russian)是在該用拉丁字母的地方用看起來相似的西里爾字母所取代以讓人想到這個詞與俄羅斯、蘇聯、東歐有關。


推薦閱讀:

為什麼斯拉夫民族沒有創造出自己的文字系統?

TAG:西里爾字母 | 語種辨認 |