【體育與語言3】外語人名音譯轉寫的規範化討論——總論

02-14

【體育與語言】系列

宋寧世：【體育與語言1】體育運動中外名稱用語考

宋寧世：【體育與語言2】世界各國足球聯賽名稱考

分論部分①輔音篇

【體育與語言3】外語人名音譯轉寫的規範化討論——輔音篇

分論部分②母音篇

【體育與語言3】外語人名音譯轉寫的規範化討論——母音篇

引言

「體育與語言」這個系列的宗旨，是挖掘我們在中文語境下所接觸的體育信息與其原文語境有何具體差別，在這個系列的前兩篇里，我們涉及的其實是同樣的話題——由於漢語比較排斥音譯，導致對於體育領域的一些專有名詞概念，漢語進行了大量的意義轉換，使得使用漢語的我們在接受同一件事物時，可能無法很快還原回原來的語境。這篇文章，我們就把眼光放到漢語音譯系統上，討論一下，在必須使用音譯來翻譯外語概念的時候，我們該要如何應對。

毫無疑問，體育圈子中文語境中接觸外語音譯的頻率最高的愛好圈，我們需要處理大量的外國人名、地名、球隊名，這之中又以接觸範圍遍及西方每一門主流語言的足球圈子為甚。在足球圈子裡，一個經久討論的話題，就是外國人名的「正音運動」，從早年的「亨利/昂立」「溫格/旺熱」和「哈維」的問題，到現在，已經陸續有從歐洲各民族的文化背景出發的人名讀法科普出現，像「里傑卡爾德」這種著名的翻譯錯誤已經能為人所知。

不過本文並不討論外國人名該怎麼讀這個問題，本文的主題是我們說的漢語本身，即在知道了外國人名的正確讀音的前提下，如何用漢語普通話讀音的漢字來把它寫出來？

這個問題在互聯網時代的重要性顯而易見——互聯網主流媒介是文字，我們如果想要通過互聯網查找外國人名、地名，得保證起碼的命中準確率，比如在搜索引擎中輸入「沒息」，即便讀音能近似阿根廷足球運動員Messi，但搜索引擎不會給你任何Messi的信息。對於漢字這套不表音的文字系統，一套讓全中國人都能準確地描述「Messi」這名運動員的規範，這更是至關重要的。

這篇文章討論範圍不僅限於體育的領域，簡單說是類似「特朗普」還是「川普」的廣泛問題，本文的「規範化」討論，旨在根據當今中文媒體界外語人名、地名轉寫的現狀進行一點總結，並討論一些與語言有關的問題。

總論——外來語音譯轉寫的問題

學過日、韓語的同學都知道，當代的日、韓語中外來語入侵之勢劇烈，大量直接音譯自以英語為主的外語的辭彙充斥著日常生活。但中國人對於這種外來概念直接音譯的處理方式顯示出了很大的不適應，也很難理解日、韓語中的音譯詞泛濫的現象。在「體育與語言」系列的上一篇里我們也看到，中文對音譯高度排斥，以致用自己的術語給全世界足球聯賽重新起了一套的名字，而日韓則全部是音譯（以致中超的名字都是英語）。

為什麼中文如此不喜歡音譯？主要原因可能是，中文對於讀音的處理，長期以來一直是「標音」而非「記音」。從古代的反切法，到注音符號，再到漢語拼音，中文所做的一直是在給出視覺提示——漢字的前提下，說出這個符號的讀音，而不是在給出聽覺提示的前提下來記錄下該讀音。這使得中文習慣於一字一音一意，而很不適應音譯時多個沒有意義的字堆疊在一起的這種不平衡的表達，只有人名、地名這些養成了整體理解習慣的事物例外。而日韓在發展出本民族的記音符號後，能相對接受這種不協調感，可以適應大量的外來概念轉寫。

但是中文的字音意合一系統仍然有一個副作用——不適合處理「同位異音」（allophone）問題。對於這個語言學概念本文不細講，只要舉幾個例子就能明白了。比如an這個韻母，普通話中安、單、山等字發音是符合規律的/an/，但當an前面有介音i（y）時，組合出的煙、顛、仙等字的an韻母要發成/?n/，這個音對應於世界上很多語言的en。但是，如果我們要轉寫其他語言中的/?n/，普通話雖然有這個音，卻無法單獨抽出來使用，因為這個音必須跟一個介音i，只能退而使用近似音「安」或「恩」。很多時候，取近似還是取帶枝節的原音，這導致了音譯轉寫的分歧。

另一個問題則是，單靠漢字進行轉寫，前提是某個音得要有這一個字。但有時候，由於歷史演變，或是某些讀音本來就沒產生，使得某些聲韻母組合即便我們可以用拼音拼出來，現實中卻並沒有這麼一個字。以i這個母音為例，在普通話音系中，fi、gi、ki、hi等拼讀不存在，zhi、shi、zi、si等又有同位異音變化，這使得以字為單位的轉寫存在很大限制。

簡單統計分析

作為直觀的討論，我從2014年世界盃除去日本和韓國之外的30支國家隊的名單中，匯總了所有球員的中文譯名。名單來自中國媒體的官方報道（2014年巴西世界盃32強最終大名單--體育--人民網），世界盃名單給我們提供了非常豐富的樣本，基本涵蓋了世界上的主流語言，30支球隊的所有球員的全名一共有3400來字，我把出現次數超過5次的字按出現的次數總結在下表，並給出一個粗略的可能對應原讀音的關係：

由此表可以看出漢語普通話音譯轉寫的一些普遍現象：

1. 不支持多輔音組合和鼻音外的輔音詞尾（閉音節），使得斯、特、德、克、爾這些單輔音專用字的出現頻率非常高。這個規律在日韓的轉音中同樣存在，日語本身沒有閉音節，韓語雖然允許輔音結尾，但由於韓語的p、t、k類詞尾不出聲，在轉譯外來語時仍要單列為一個帶母音的音節。

2. 不區分舌音r和l，這是亞洲語言里非常普遍的現象，日韓同樣也完全不分。對於詞頭的r/l，漢語一般歸併入l。有意思的是，基於北京音的普通話存在一個捲舌r詞尾，且對應有一系列讀er的字（通常使用「爾」），這個讀音非常適合模擬世界語言中單輔音出現的r/l，而不至於像日語那樣只能轉成「ru」。這個「爾」字在很多方言里跟舌頭完全挨不著邊（比如粵語讀yi），所以香港的粵語翻譯對於舌音經常直接跳過，比如「朗拿度」（羅納爾多）「尼瑪」（內馬爾），給大陸人造成費解。

3. 沒有v這個音，這也是中日韓的共同現象。和日韓用發音位置類似的唇音來擬v音不同，普通話音系使用一個不是唇音的近音w（但單獨出現的v傾向於轉成f），相比日韓不分b/v，普通話是不分v/w。這牽涉到了後面會討論到的「聽感」和「讀感」音譯原則的問題，這裡先不細說。

另外，在這張表裡，普通話里讀音完全一樣的字有：

西-希、馬-瑪、弗-福、博-伯、維-韋、奇-齊

聲韻母相同，只是聲調不同的字有（按四聲順序排列）：

里-利、羅-洛、科-克、西-希-席、迪-蒂、加-賈、夫-弗-福、波-博-伯、姆-穆、菲-費、盧-魯-路、伊-易

第一種情況里，除了馬-瑪完全等同，剩下幾組其實都是有規律的，比如西-希組，西用於si，希用於hi（經典的尖團音關係）；弗-福組，弗用於fu，福用於fo；博-伯組，博用於bo，伯用於ber；韋-維組，韋用於wi，維用於vi。後面幾個是比較經驗性的法則，對應不到什麼語言學規律，現實中也時有混淆。從弗-福、博-伯這兩組字里能看出，o這個母音在普通話里是個很令人頭疼的問題，後面的分論里我們會細講。

第二種情況，後面會我們專門講外來語音譯中如何使用聲調的問題。這幾組字里，有區別明顯的，如姆-穆、加-賈、迪-蒂，也有看不出什麼區別的，如羅-洛、菲-費。

「聽感」還是「讀感」

在外來語的音譯中，一個貫穿始終的原則性問題是，「聽感」和「讀感」孰為優先？也就是說，我們的音譯轉寫，是應該記錄下聽到的語言並盡量模仿出相似的聲音，還是應該盡量模仿外國人說話的方式來讀出一個外國名稱。很多時候後者更重要的意義是，盡量區分開兩個名字不同（但聽起來像）的事物。比如將現任美國總統叫做「川普」，就是聽感主義，而叫成「特朗普」，則是讀感主義。

對於這兩者，主要的區別在於，我們要是要應用這些音譯來跟母語者溝通，還是單純把它們作為記錄的符號。事實上，單靠幾個漢字不可能模擬出母語者的語境，因為漢語的音系與西方語言差別太大了，「川普」之名純粹只是聽起來「像」，但你說出普通話的「川普」，這兩個字的聲母、韻母、音調，跟英語發音都不是一回事。實際上Trump的中文譯名只需要在中文語境中存在，我們需要盡量保證Trump這個人和另一個可能叫Champ的人不混淆，所以從發音方式上分解出來的「特朗普」才是正式場合對這個人物的官方稱號。

「聽感」主義的另一個問題是，我們依靠的「聽」是指何種口音？比如像法國足球隊這樣的一整支隊都找不到一個本土出身的陣容，靠聽寫法國巴黎標準音的方法來定義他們的名字，這終歸顯得很奇怪。比較正確的處理，應該是在尊重本人出身和母語的前提下，盡量按發音的方式來轉寫名字，但盡量不要記錄某種口音的流變。比如「tr」這個組合，聽起來像ch這只是標準英語中r的發音特殊導致的口音現象，這種轉變並不需要去記錄。

當下中日韓的官方在原則上都傾向於讀感主義，即主要依據本民族語言的發音方式來轉寫外語，而不特別記錄外語的口語讀音中的音流變。在很多細化的問題，比如清濁音處理、本族語言沒有的語音的近似、閉音節和重音表記等問題上，區分主義都優於等同主義。在後面的輔音和母音的分論里，本文也會默認以讀感主義為主要處理原則。

聲調的使用

漢語區別於日韓語的一大重要特徵是，漢語中有充分的具備區分音位功能的聲調，並且聲調系統是與一字一音一意模式綁定。普通話中，不考慮聲調所具有的音節總數大概400個出頭，而考慮了聲調後允許的音節能超過1300個，接近了保留複雜韻尾的朝鮮語的常用音節數量。相比日語算上全部濁音、拗音和外來語專用音總數也就100個多一點。

在現實使用中，聲調的作用時常被忽視。漢語拼音方案雖然制定了聲調的標號，但由於符號不容易適配計算機鍵盤，在現實中不方便實用。人們在需要表述語音的場合，比如轉述方言詞或擬聲詞時，基本不會特別加入普通話的聲調來完善定義。

中文對於聲調系統的作用，有一個很形象的成語——抑揚頓挫，這個詞概括了基本的韻律現象。普通話對於「頓挫」不太敏感，表示「頓」的長母音、聲門塞音，表示「挫」的閉音節收音，在普通話中都大為簡化。但普通話對「抑揚」的表現非常豐富，普通話的聲調里，一聲（55）為平調，二聲（35）為強升調，四聲（51）為強降調，三聲（214）在口語中常簡化成21，可以視為弱降調，也可以近似做弱平調。對於輕重重音語言，用四聲漢字表示重讀，非四聲字表示非重讀，這個規則在上面列舉的若干同聲不同調的組合中有諸多例子，如里-利、羅-洛、科-克、迪-蒂、姆-穆、菲-費等。

但是，在世界很多語言中，重音並不產生意義的區分（最多產生英語里的語法區分，比如名詞的重音前移），對於人名、地名這種具體概念，從前面「讀感」主義出發，拘泥於重音位置會不會顯得有些多餘？但既然普通話對長母音、閉音節的區分偏簡單，再不區分重讀，似乎整體的辨別力就很不樂觀了。還是以日韓為例，日語明確區分長短母音，用促音強調重讀閉音節；韓語有長母音但書寫上不標，有閉音節，有帶重讀特徵的緊音。日語的音系簡單，於是對長音和促音摳得特別死，專有名詞基本是能標就必須標（非專有的外來語倒可能會簡化）。對普通話這種音系也不算複雜的系統，盡量發揮出聲調的作用，起碼還是「推薦」的。

在實踐中可以採用的做法是：盡量避免在不重讀的位置出現四聲字，避免在該重讀的位置出現一聲字。三聲字有弱的降調走勢，但調值變化不那麼明顯，可以作為通用的選擇。但實際情況仍要複雜，比如普通話中很多音所有的調有限，te、le只有四聲，de只有二聲，而且譯音用字時常要考慮諸多其他音素，如何選字這也是一門學問，下一節我們會專門討論這個問題。

用字的原則

漢語的音譯系統的另一個問題是，我們得盡量讓讀者看出這個詞是單純的音譯。日文有片假名，韓文有詞間空格，這兩者都有一定的區分作用。但對中文而言，突出音譯概念只能靠盡量地剝離漢字的意義，使讀者先入地聯想到讀音。在具體應用中，這幾條原則是應該注意的：

1. 不要用太日常的字，比如的、不這種虛詞字，或是打、開等太通俗的動詞。像「不列顛」「伏打」這種老譯名里的「不」「打」字就不太合適，現在基本都只用「布」。

2. 不要用意思太直白的字，比如數字，日常的形容詞、顏色詞，以及意思直白的名詞，這些字很容易讓人理解為意譯。過去對英語人名常用的「大衛」「山姆」這些譯名里，「大」和「山」就太直白，不適合用來表音，現在也已普遍改成了「戴維」「薩姆」

3. 不要用貶義或不雅觀的字，包括不雅觀的偏旁部首，這很好理解，畢竟我們主要音譯的對象是人名和地名，給人安上不好的字型大小顯然是不合適的。這一點主要涉及到上一節所說的聲調選擇的問題，有時候某個讀音有多個聲調可用，但有些聲調可用的字若不太文雅，這也不適合使用。對於偏旁，像蟲、犭、月、疒、飠這些會聯想到食物、動物、人體的偏旁也是不建議用的。

4. 音譯詞語內部不要能組合出實意，比如「川普」這個名字的一個問題在於它的字面會產生「四川普通話」這樣的意義。

當然，最關鍵的一點，用的字得讓大部分人認得，不要用生僻字，這點就不用強調了。有時「生僻」不僅僅指讀音，若讀音清晰但聲調不夠明確，也盡量不要選用。另外，常用字的生僻讀音，或者名詞用字的非名詞讀音，也都不適合使用。

我們結合上面圖表來舉兩個簡單的例子：

La音，普通話里不生僻的讀音有lā和là，lā音有一個音譯高頻字「拉」，là音的常用字里，臘、蠟、辣都不太雅觀，老音譯中有「希臘」這樣用四聲標記重讀的譯法，但現代音譯已經全部按「拉」字處理，但是用「拉」這個平聲字來表記重讀的確不太科學。

有類似情況的字還有多、茲、恩、蘭、梅等。

Bei音，普通話里不生僻的讀音有bēi、běi和bèi，bèi音有音譯高頻字「貝」。但相應的平聲bēi音的常用字里，杯、碑偏直白，卑、悲則帶貶義，都不適合使用。běi音只有一個「北」字，這個字同樣過於直白。老譯音里有「卑爾根」這樣的名稱，但現在已統一使用「貝」。「貝」作為去聲字，很容易誤導重音的位置，比如以前波蘭有過一名黑人選手「奧利薩德貝」（Olisadebe），一個譯名連續冒出了四個去聲，這實在是逼瘋強迫症的翻譯（關鍵是重音偏偏是在唯一是平聲的那個「德」字上）。

有類似情況的字還有曼、霍、布、諾、納、沃、庫等。

附錄：中日韓人名音譯的比較分析

在這一節，我用相同的方法製作了2014年世界盃人員名單的日、韓語轉寫的音節頻率表，摘錄於下（均不統計日本隊和韓國隊）。日韓的名單皆來自維基百科，參賽球員的樣本總數為23*30=690。

其中，日語中的拗音以及ファ、ウェ這種兩個假名複合而成的外來語專用音節皆表示成一個整體的音節，長音和促音則單獨計數。韓語統計出現次數超過5次的音節。

日語人名轉寫音節頻率統計

韓語人名轉寫音節頻率統計（出現5次以上）

將中日韓的數據匯總，結果如下表所示。

對於中文，字元總數表示不同的漢字，音節總數包括合併同音同調和合併同音不同調兩種情況。日文的字元總數中，大寫和小寫的假名以及促音、撥音、長音皆分別計算，但不計入人名中的分隔符?和=，音節總數中小寫的假名與前音歸併為一個音節，撥音作為一個獨立音節（日語的外來語中允許撥音ン位於詞頭），促音和長音視為衍生符號，不計入總數。韓語在理論上有不同字同音的問題，但外來語轉寫系統里為此專門設計過，比如韻尾只允許鼻音和k、l，在這裡字元和音節數量視為相同。

中日韓排名前25位的字元匯總如下：

由於三國媒體對於球員全名的處理標準不一，尤其因為世界盃上拉美系球隊很多，而西語人名的構成相當繁瑣，單名、雙名、三名、綽號標記都能見到，所以字元總數的統計偏差較大。不過我們直接列舉幾個具體的個例，簡單看看三國語言音譯的「字元效率」對比：

Neymar da Silva Santos Júnior

內馬爾·達·席爾瓦·桑托斯·儒尼奧爾

ネイマール?ダ?シウバ?サントス?ジュニオール

???? ? ??? ??? ????

Lionel Andrés Messi

利昂內爾·安德烈斯·梅西

リオネル?アンドレス?メッシ

??? ???? ??

中日韓都有把複合輔音拆分成單獨音節的習慣，所以整體而言字元的佔用空間相差並不算太大。日語不帶鼻音韻尾，加上長音、促音區分嚴格，空間佔用顯然是最多的。中文相比日韓的一個長處是支持i結尾的複合母音（ai、ei），而日韓都需要抽出一個母音i。但韓文不僅有充分的鼻音韻尾（m、n、ng），同時也支持l直接作為兒化尾，這方面比中文節省一些，所以字元總數上中韓應該不相上下。

考慮不重複的字元，日文基本是把能用的符號都用了。日文的母音簡單，尤其缺乏中韓語言中的表現弱化音節的母音（拼音的e、韓文的?），使得日文只能用u或o來表示輔音從里的單輔音，比如日文里無法區別st和suto，而漢語里用斯特和蘇托就可以輕鬆實現。這導致日文的高頻音節的出現次數還要遠多於中韓。

有意思的是，韓文除去大量只出現1次的音節後，使用的字元數量其實跟中文差不多。韓文並不像日文那樣，對於閉音節高度敏感，所以收音和緊音的出現頻率都不高。比如按日語的做法，梅西在韓文里應該表示成??，但這樣重音就落到後面的si上了。韓文中還有一個有意的點，儘管對應漢語「爾」的?已經在高頻使用，但仍有大量的l韻尾的音節出現，也就是這個音可能單抽出來也可能放前面詞尾，這應該是韓語為了規避l的音變做的處理，尤其是避免l跟後面n、h發生連音的問題。

將中日韓三語的音節出現次數和排名製作成折線圖。由此圖可以看出，三國語言人名音譯的高頻音節都在60個左右，60位之後，無論音節最複雜的韓語還是音系最簡單的日語，音節出現頻率基本趨同。但日語的高頻音節的使用頻率仍要明顯高於中韓。中韓在15位之前有一些差距（可能是人名使用全名的問題），但15位之後的字頻十分接近，這一點體現了中韓轉音系統的類似，比如都有鼻音尾、都有i和u兩套介音等。

附錄②：

本文儘可能地只用「普通話」而避免使用「漢語」，是因為對音譯的問題，不同方言的結果差別太大了。當今我們可能會接觸到的一個方言音譯系統是香港地區的粵語音譯，我根據自己的觀察簡單總結一下粵語對外來語音譯與普通話的不同點：

1. 粵語中尖團音仍區分，所以ki、hi、si等常見音可以比較好地區別。

2. 粵語有m鼻音尾，帶m尾的音節可以只用一個字，尤其是經典的「咸」（ham）。

3. 粵語的e、o類母音接聲母時可以不跟一個介音i或u，類似do、le這樣的音處理起來更方便。

4. 對於粵語的p、t、k韻尾該不該用，目前香港的音譯系統並不統一，但主流是不用，即p、t、k仍要作為一個音節處理。

5. 粵語缺少成對的塞擦音-擦音，比如普通話的平舌和捲舌，所以s/sh、ts/ch、z/dge等在粵語中無法區分。

6. 粵語缺少中央母音，轉寫輕讀的音節不太方便，比如粵語只能用「達」（daat）來轉單輔音t。

7. 粵語沒有普通話里的捲舌兒化尾，對於外語中單獨的r/l尾的處理也比較混亂。

現在香港體育網站的人名系統，基本處於外文原文、傳統譯名、民間譯名和大陸借用名四者並存的狀態，甚至一個名稱里經常有粵語音和普通話音雜糅的現象。似乎香港沒有一個新華社級別的機構頒布專門的統一音譯用字規定。

參考資料

2014年世界盃中文名單：2014年巴西世界盃32強最終大名單--體育--人民網

2014年世界盃日文名單：https://ja.wikipedia.org/wiki/2014_FIFAワールドカップ參加チーム

2014年世界盃韓文名單：2014? FIFA ??? ?? ??

擴展閱讀

【趣話體育】系列

趣話體育2——時間的科學

宋寧世：趣話體育——排名的科學