遊戲的漢化過程是怎樣的?
我很喜歡玩遊戲,尤其是單機遊戲。有時候玩到一款漢化過的遊戲後我就特別想知道英文是怎麼變成中文的。英語水平還算可以,也有打算加入一些漢化組貢獻一份薄力。
漢化組應該有一個特別牛叉的軟體,能夠提取出遊戲裡的所有文本,之後通過機翻和人工校對後又可以直接套入遊戲里去,這樣一款遊戲就漢化成功了。(純屬意淫…?_?)如果上面一段話確實是個偽命題,那麼問題來了:1.是否存在類似的軟體?2.遊戲里的文本是怎樣提取出來的?3.為什麼會有亂碼現象?
4.為什麼不把漢化做成png圖片直接貼進遊戲里?希望懂行的前輩們不吝賜教。
官和民有點區別,
官方版通常少一個破解的暴力過程,文本應該是直接被提供的,不用手撕加密。
翻譯差不多,誰翻不是翻啊,不過官方版通常會有一個禁忌表一樣的東西,
除了髒話生殖器這種通用忌諱之外,官方版的政治敏感度高得蛋疼,你們在看到的各種沒有硬性大錯誤,但是又不太那麼像是個人話的句子基本都是拜這個列表所賜。校對過程比翻譯辛苦多了,
比較糟糕的初翻可能導致校對人員對翻譯做出一些不可彌補的衝動行為。
還有一些比較雞毛的就是編碼適應性,
特別是日中之間比較容易有外字問題。比如賈詡蔣琬鍾繇,不做特殊設定都是亂碼。GBA/PSP算是漢化遊戲最肥沃的一塊土地了,當年卡在字型檔的民間組不要更多。
很多時候是要犧牲描述性文字滿足字型檔要求的。我經手過某個遊戲印象深刻,校對後的文本是泫然欲泣,程序說字型檔不夠了你剪一下怪奇漢字。違背著良心改成了就要哭了,你體會一下我的心情。D商漢化技術不過關很多時候都有這種問題,把五十音的字型檔強行換成常用漢字,
其他漢字就聽天由命了,好在簡體圈人民基本都能看懂繁體漢字。所以當年D商的口袋小畜生你會看見很多特定PM的怪物都是鬼話連篇的。
再舉個例子,D商漢化的FF1+2(GBA),裡面回復魔力的道具原文叫Ether。D商估計是查詞典查的這東西叫乙醚,日文字型檔估計有乙,醚那肯定是沒有了他們把這玩意叫什麼呢。広復
解釋一下為什麼叫這個:這倆字沒占字型檔。
本身GBA那個小屏幕,道具欄里的字就更加小了,魔字顯示不出來,跟黑疙瘩似的。日文叫エーテル,英語叫Ether,你中文就算叫魔法葯也會變成◆法葯,肯定看不清。復字就是復,直接用的字型檔里。
広其實是廣,估計是他們找了個看起來跟魔差不多的字兒湊合用了。魔復!回復魔力的東西!這下你能看懂了嗎!官方版改圖效果一般比民間版高一點,
人家直接給你分好層的PSD,不用你一點一點兒摳。為什麼我說神海4那個日狗屬於非常不可原諒的問題。
他要是直接翻日狗也就算了,肯定是日作為動詞算髒話不能用,也就是他注意到了管的松的話那句話可能就翻譯成媽的,或者操什麼的。你弄那麼一句顯然是有意不好好乾活。要用一句話解釋的話就是遊戲是通過引擎執行腳本達成的效果,包括顯示文本,播放音樂,執行玩家輸入,所以你理解了遊戲的腳本就知道了數據怎樣存存在哪,那麼自然就知道怎麼漢化。
詳細解釋的話就是理想很豐滿現實很骨感。對於主機遊戲來說,例如psp,這些遊戲主機規定了遊戲的數據格式,所以工具可以通用漢化起來難度不大。但是對於pc遊戲來說因為沒有遊戲主機的硬性規定,所以數據文件存放方式和格式就得看程序員的心情,就算是同一個引擎都會有不小的差別。目前對於大部分pc遊戲的漢化並沒有十分通用的方法,只能通過逆向反編譯遊戲引擎來理解數據加密方式和壓縮方式還有存儲方式,然後寫工具去提取,翻譯完成後再寫工具去回封。一個好消息是你不需要把遊戲引擎全部指令都反編譯出來,只需要知道數據相關的就行,當然也有人會把整個引擎的指令都逆向解析出來,這樣甚至可以製作工具來達到自製mod的目的,而某些用lua當腳本的遊戲自製MOD更是幾乎沒有技術難度。另外對於一些遊戲可能還存在編碼問題和字型檔的問題(亂碼可能就是這兩者的原因)還有防盜版的問題,這就需要對可執行文件進行額外的修改。
多年以前痴漢工賊寫過一個叫crass的通用提取工具能提取當時幾乎所有黃油的資源文件,但實際上也是通過不同引擎對應的插件來提取資源的,所以自從痴漢工賊隱退後這工具就沒人維護,現在也就對新出現的黃油就無能為力了。
至於機翻再人工校對就是痴人說夢了,目前機翻效果太粗糙,再加上還要聯繫上下文,這樣校對的成本還不如自己翻譯一遍。漢化組應該有一個特別牛叉的軟體,能夠提取出遊戲裡的所有文本。
沒有的 雖然沒做過漢化,而且因為玩原版能夠裝逼,所以我現在習慣玩原版(steam上的日文英化遊戲倒是要打日化補丁,因為我英語渣),但是我還是可以說說的 我這裡以gal舉例吧,破解的話我就熟gal和RM。 gal的話,文本有一個獨立的文件夾,破解組(不同遊戲的系統不同,加密也會不同,ExtractData的確可以解一部分舊作的包,但是大部分還是解不了的,所以破解組才是大神)提取出文本,然後漢化組漢化後交給潤色組(沒記錯的話一般gal漢化要求N2潤色N1),然後把轉區的文本的字體拿出來在用中文區打開覆蓋(日文區和中文區不一樣,原版gal得用日文區打開才不會亂碼,所以漢化組漢化出來的應該要轉區的。應該是這樣,除非不是)。全部弄好(有的組改圖,有的不改,我見過「最懶」的組就改了遊戲文本,標題什麼的都是亂碼,而且用日語環境文本反而亂碼了)後封包,漢化版完成。 不用的遊戲漢化也會有所不同,我就說我見過的幾種吧。 1,替換式。原遊戲的文本、圖片單獨封包成文件,漢化組也做了漢化文本和圖片,然後替換掉,完成。 2,替換。製作一個能夠打開遊戲的exe,裡面包含了漢化文本。不需要打開原遊戲exe,打開漢化exe即可。 3,注♂入式。和第一種類似,但是應該是直接把文本注入原來的文本替換掉(這種我也不清楚,主要是我的360報毒我就這樣認為了。)————————————————————————————我順便說說RM——RPG maker的漢化吧。
RPG maker簡稱RM,是日本製作的製作RPG遊戲的軟體,這軟體上手簡單,只需要有想法就能做齣劇情很好的遊戲;同時又可以加入代碼,做出各種神奇的效果。舉個例子,RM默認戰鬥時像DQ的形式,但是RPG探検隊(應該是這個名字)就製作出橫版的戰鬥,雖然還是很原始,但是能看到人物的動作卻是質的飛躍。後來有不少人用這系列軟體來做同人H遊戲,我沒駕照就不開車了。 我剛才說系列,是因為這個軟體的確是有系列,中國最為流行的應該是RMXP(圖標是太陽)、RMVX(馬頭)、RMVX ace(龍頭),除此以外,又有RM2000(代表作廢都物語),RM2003(代表作大雄的生化危機)、Wolf RPG(狼頭,不過狼頭和RM好像不是一個系列)。此外好像還有RMMV和一個新出的,不過我沒用過。 順便一提,如果修改遊戲的話,XP、VX、VXace的數值都是要乘2再加1才能搜到。 話歸正題。RM製作的遊戲除了標題外,在中文區下打開也不會出現亂碼。此外,RM的破解難度也是最為簡單,大部分使用默認加密的都可以通過一個簡單的軟體解包(多年前找到的,作者好像不希望這個廣泛傳播)。這樣我們可以獲得幾個文件夾(加密是RM自帶的功能,有的遊戲直接不加密,也是這些文件夾) Audio這個是放聲音,裡面有BGM、SE、BGS、ME,一般用ogg格式,有部分使用mp3但是會變得很大 Graphics,圖片文件夾,裡面的是直接就能看到的圖片。裡面包括Animations(特效)、Battlebacks(背景)、Battlers(敵人)、Characters(一般放角色行走圖、當然船、戰車的行走圖也可以)、Faces(不解釋)、Pictures(遊戲中插入的圖片、一般人用來做OP和ED,當然H遊戲的CG也是放這裡)、System(邊框和建築物的貼圖) Data文件夾里的東西必須要用RM打開,裡面就是地圖、代碼、物件之類的信息。 說了這麼多我就想說,漢化RM的遊戲,除了改圖要去文件夾外,其它的都要用RM改。 具體就是,打開RM,然後替換文字,完成。漢化遊戲我也只是接觸過,並沒有很多的實際操作,不過了解的應該還算比較多吧。 你對漢化組想的太簡單了,並不是所有的遊戲都是用一個引擎做出來的,而且很多引擎存在版權問題,不能進行反向編譯,所以所謂的提取文字的軟體是不存在的。實際上是怎麼漢化的呢? 我曾經參加過一個RPG遊戲的漢化,遊戲的製作軟體是RPG Maker VXAce,這個軟體製作遊戲簡單粗暴,說簡單點就是用一個個圖片做成一個地圖,然後在地圖上設置各種各樣的NPC,事件之類的,然後資料庫寫一下,根據自己需要的特效插入一些JS文件再測試一下就可以打包發售了。 因為遊戲的文字顯示是一個事件,所以必須在製作事件的時候就要寫進去,XP以後的版本還算比較人性化,編程界面用不同的方式標記出了文字,而且是中文說明。之前的版本,比如說2000,一整條都要你自己編寫,從人物移動,文字顯示到變數變化,開關開/閉都要自己用計算機語言寫(還必須用RGSS寫,RM用的都是RGSS,而且版本不同的RM用的不同的RGSS),難度是非常大的。
所以說,如果要漢化這些文字,必須找到這一個個有事件的點,然後打開,一行行找下去看哪裡有文字需要漢化,找到了就開始翻譯,翻譯完了就把原先的那段話替換掉。差一點的漢化組只是單句話翻譯,不會像一些良心漢化組,把所有的文字按照出現順序全部收集起來,然後翻譯並且根據上下文進行修改(相信英語做過完形填空的都深有體會)。
一般這樣的一個RPG遊戲,漢化大概需要2-4周時間,還不包括爭取作者同意這些時間,畢竟人家是作者,能不能聯繫的上還是問題,而且購買這款軟體又得花上一筆銀子,百度有破解版,但這裡不推薦用,畢竟要尊重別人的勞動成果。 既然說到這裡就再說說字體庫問題吧。玩漢化遊戲的時候,尤其是90後記憶中的GBA遊戲的時候,會發現有些句子根本讀不通,文字亂碼,有的字很小有的字很大,甚至到一半是中文一半是英文的都有。什麼情況呢? 句子讀不通怪翻譯者的漢化水平不行,也有可能是因為字體庫里沒有這個字,沒辦法只能用其他辦法替代(比如說語文考試的時候,你想寫「兩鬢斑白」,結果鬢這個字你不會寫,然後你寫了個「兩賓斑白」,或者「兩邊的眉毛都白了」,閱卷的語文老師一臉懵逼)。 文字亂碼,問題還是出在字體庫。中文打進去了,字體庫里沒這個字,沒辦法只能顯示各類亂碼。 有的字很小很大,還是漢化組的鍋。只不過這個漢化組有本事,用的是圖片。圖片上就是這個缺失的,字體庫里沒有的字。自己看看你可以發現這個字與邊上的其他字大小,粗細,上下的位置都不一樣。能看就行。 在這裡還要再提一個,為什麼漢化遊戲,中文繁體這麼多而簡體這麼少呢?很簡單啊,中文簡體會出現上述情況,而中文繁體不會,所以都用的繁體。不過我相信大家都看得懂中文繁體吧? 最後說幾個漢化組(只限我認識的,我範圍比較窄,不要在意),比如說手談漢化組,莉莉絲漢化組(記得不是很清楚,可能完全記錯了,這個漢化組漢化過狂父,鬼子母神之夢之類的非常多的RM遊戲)。 順帶一提:小本子的漢化,那可就完全是PS上直接用白色畫筆塗掉原來的字然後用文字功能寫上去。簡單來說分為一下幾個步驟
1.破解程序,提取文本
2.翻譯,校對,潤色3.封包,發布官方翻譯團隊來解答一下...
一般是研發團隊直接把文本從代碼里提取出來,有時候是嵌入代碼直接給到譯者。
然後安排譯者分別翻譯並且整合校對完畢之後,再由開發人員將文本重新導入遊戲build裡面。
你所說的亂碼,大概是民間漢化團隊在提取代碼的時候出錯或者是不熟悉開發語言導致的問題。另外就是有些遊戲只支持特定的字體和編碼,如果民間團隊自己做的話不一定知道開發團隊所用的是什麼字體和編碼,也很容易出現亂碼的問題。
做成圖片也是有的,但是修改難度更高,也更費時費力。但遊戲里有些部分的確是圖片格式,這部分的文字是無法導出的:例如UI、地圖等。
如果你喜歡做遊戲翻譯,可以先試著加入一些漢化組練練水平,以後說不定有機會加入專業團隊。
看提問的描述,機翻自潤已經成了再正常不過的事了嗎?
簡單說下中文翻譯到外文的步驟,外國遊戲官中應該也是類似的步驟:
1、整理遊戲中所有文字,建立配置表,提交給翻譯;2、整理UI中所有帶文字的,提交給翻譯;3、從翻譯那拿回來重新導回遊戲替換原文件,打版校對補漏。看似簡單,不過每一步都是體力活,網遊的話還要考慮後端的文字怎麼處理。啊吶, 答主只是個接觸過一點的高中生啦...所以大膽回答一下...
如果有錯什麼的話歡迎指出呢...首先先說一下, 個人印象中的漢化應該是指本地化...localization, 就是...把文本什麼的改得該區域(本地)的人可以理解...?
1.是否存在類似的軟體?
存在這種軟體的啦, Passolo什麼的都可以當然只是針對exe或dll內置的文本啦...大多數遊戲漢化都沒這麼簡單的呢...上面那種東西大概就只能拿來改改說明什麼的...2.遊戲里的文本是怎樣提取出來的?
啊吶...不了解23333 如果是標準資源的話(resource)就是直接讀取...非標準的話需要一些逆向的知識...?看遊戲的來源也會有好些不同...( 不過貌似可以直接提取出來的真的沒多少 )3.為什麼會有亂碼現象?
因為原版的程序不支持顯示那些文字, 例如XNA的遊戲特么每個字都要弄個圖4.為什麼不把漢化做成png圖片直接貼進遊戲里?
啊吶, 因為會很大? 不過XNA的遊戲的字就是某種貼圖 ( .xnb文件, spritefont字體 )答案或許會和大多數人感覺的不同呢...因為C# XNA遊戲就是這麼不一樣...噗...大概就是沒加殼的拿個小工具丟進去, 過一會兒就拿到源碼了...( 笑看非.Net的複雜逆向推薦閱讀:
※如何評價虛擬搖桿在手游中的廣泛運用?
※獨立遊戲在國內有戲嗎?
※是否非攻擊性的交互難以在塑造情感的同時塑造遊戲性?
※你會開發一個什麼樣的遊戲給女朋友當生日禮物?
※在國內遊戲行業,遊戲策劃是最沒有技術含量的一個崗位嗎?