GAN之父:讓機器擁有天賦 我還在對付利用AI作惡的人
本文系網易智能工作室(公眾號smartman 163)出品,此篇為AI英雄人物第65期。
選自:MIT Technology Review 編譯:網易智能 參與:小小
本期嘉賓為伊恩·古德費洛(Ian Goodfellow),他因提出了生成對抗網路而聞名,他被譽為「GAN之父」,甚至被譽為人工智慧領域的頂級專家。
資料顯示,古德費洛等人於2014年10月在Generative Adversarial Networks中提出了一個通過對抗過程估計生成模型的新框架,框架中同時訓練兩個模型:捕獲數據分布的生成模型G,和估計樣本來自訓練數據的概率的判別模型D。G的訓練程序是將D錯誤的概率最大化,這個框架對應一個最大值集下限的雙方對抗遊戲。可以證明在任意函數G和D的空間中,存在唯一的解決方案,使得G重現訓練數據分布,而D=0.5。在G和D由多層感知器定義的情況下,整個系統可以用反向傳播進行訓練。在訓練或生成樣本期間,不需要任何馬爾科夫鏈或展開的近似推理網路,實驗通過對生成的樣品的定性和定量評估證明了本框架的潛力。
通過讓神經網路互相攻擊,伊恩·古德費洛(Ian Goodfellow)創造出強大的人工智慧(AI)工具,賦予機器以想像的能力,現在,他和我們其他人必須面對這種工具帶來的後果。
2014年的的某個晚上,古德費洛和一名剛剛畢業的博士生共同喝酒慶祝。在的蒙特利爾頗受歡迎的酒吧Les 3 Brasseurs,許多朋友請求他的幫助,因為他們正在開發一個棘手的項目,即可以自己創作圖片的電腦。
生成對抗網路的誕生
這些研究人員已經在使用神經網路,即模仿人腦神經網路建立的鬆散模型演算法,作為「生成」模型來創建自己的新數據。但結果往往並不如人意:電腦生成的人臉圖像往往是模糊的,或者出現像丟失耳朵這樣的錯誤。
古德費洛的朋友們提出的計劃,是對構成照片的元素進行複雜的統計分析,以幫助機器自己創作圖像。這就需要大量的數字運算,而古德費洛告訴他們,這根本行不通。
但當他邊喝啤酒邊思考這個問題時,突然想出了一個主意。如果讓兩個神經網路對抗會產生什麼樣的結果?朋友們都對此持懷疑態度,所以當他回到家,女朋友已經睡熟後,他決定試一試。古德費洛在最初的幾個小時里進行編碼,然後測試了他的軟體,沒想到第一次就取得了成功。
古德費洛在那個夜晚開發出的技術現在被稱為「生成對抗網路」(GAN)。這一技術已經在機器學習領域引發了巨大的興奮,並將其開發者變成了AI領域的名人。
在過去的幾年裡,AI研究人員使用一種叫做深度學習的技術取得了令人印象深刻的進展。提供足夠圖像給深度學習系統,它會從中學習,比如識別一個即將穿越馬路的行人。這種方法使得無人駕駛汽車和能驅動Alexa、Siri以及其他虛擬助手的對話技術成為可能。
可是,雖然深度學習可以學會識別事物,但他們並不擅長創造它們。GAN的目標就是賦予機器這種類似於想像的天賦。將來,計算機將會更好地享受原始數據,並計算出它們需要從中學到什麼。這樣做不僅能讓它們繪畫或作曲,還將使它們減少對人類的依賴,可以自行學習了解世界及其運作方式。
如今,AI程序員們經常需要告訴機器,在訓練數據中到底有什麼東西,比如數百萬張圖片中都有行人過馬路的場景。這種方法不僅成本高昂,而且勞動強度相當大。此外,哪怕是稍微偏離了所接受的培訓,AI系統處理圖像數據時都會遭遇挫折。而在將來,電腦將會更好地處理原始數據,並在不被告知的情況下計算出它們需要學習的內容。
這將標誌著AI「無監督學習」的巨大進步。無人駕駛汽車可以在不離開車庫的情況下了解許多不同的道路狀況,機器人可以預見到繁忙倉庫中可能遇到的障礙,而不需要再繞過它。
GAN的魔力在於兩個神經網路之間的競爭
我們想像和思考許多不同情景的能力是我們身為人類的重要組成部分。將來當科技歷史學家回顧現在時,他們很可能會將GAN看作是創造具有人類意識的機器的重要進步。Facebook首席AI科學家雅恩·樂坤(Yann LeCun)把GAN稱為「過去20年里深度學習領域最酷的想法」。另一位AI大咖、百度前首席科學家吳恩達(Andrew Ng)也說,GAN代表著「重要的、根本性的進步」,這會為不斷壯大的全球研究者社區提供靈感。
古德費洛現在是谷歌Google Brain的研究科學家,該團隊位於加州山景城的谷歌總部中。當我最近在那裡見到古德費洛時,他似乎仍然對他的「巨星」地位感到驚訝,稱其「有點兒不敢相信」。也許同樣令人感到驚訝的是,他發現自己現在的大部分時間都要用來對付那些想用GAN作惡的人。
GAN的魔力在於兩個神經網路之間的競爭。它模仿了繪畫偽造者和藝術偵探之間的反覆交鋒,他們反覆嘗試互相欺騙。這兩個網路都是使用相同數據集進行訓練的,第一個系統被稱為「發電機」,負責生成像照片或筆跡這樣儘可能逼真的人工輸出。第二個系統被稱為「鑒別器」,它將發電機生成的東西與原始數據集中的真實圖像進行比較,並試圖確定哪些圖像是真的,哪些是假的。在這些結果的基礎上,發電機調整其參數以創建新的圖像。這個過程反覆持續,直到鑒別器再也無法分辨真假。
去年,在一個廣為宣傳的例子中,晶元巨頭英偉達公司的研究人員對AI進行了大量投資,通過研究真實的明星訓練了一個GAN系統,以生成虛構的名人照片。雖然並不是所有虛構的假名星都是完美的,但有些卻非常逼真。與其他需要成千上萬訓練圖像的機器學習方法不同,GAN只需幾百張照片就會變得「技藝精通」。
儘管這種想像的力量仍然有限,但是只要接受過很多狗狗照片的訓練,GAN就能產生令人信服的假狗圖像,比如身上會有不同的斑點圖案,但它不能想像出全新的動物。原始訓練數據的質量對結果也有很大的影響。有這樣一個生動的例子,GAN開始將隨機字母融入到其組合的貓圖中。因為訓練數據中包含了來自互聯網的貓圖,這台機器通過自學,認為單詞也是貓圖的一部分。
華盛頓大學機器學習研究員佩德羅·多明戈斯(Pedro Domingos)說,GAN也喜怒無常。如果鑒別器太容易被愚弄,發電機的輸出看起來就不太真實。而且,對兩種決鬥的神經網路進行校正是很困難的,這也可以解釋為何GAN有時會吐出許多奇怪的東西,比如有兩個頭的動物。
不過,這些挑戰並沒有讓研究人員卻步。自從古德費洛及其同伴在2014年發表了關於他的發現首份研究之後,已經有數百篇與GAN相關的論文發表。該技術的一個粉絲甚至創建了一個名為「GAN zoo」的網頁,專門用來跟蹤已經開發出的各種版本技術。
GAN最明顯的即時應用是在涉及大量圖像的領域,比如視頻遊戲和時尚行業:比如,遊戲角色在雨中會如何奔跑?但是展望未來,古德費洛認為GAN將推動更大的進步。他說:「有很多科學和工程領域需要我們去優化一些東西。舉例來說,我們需要更有效的藥物,或者需要更高效的電池。這將是下一個大浪潮。」
在高能物理學中,科學家們使用強大的計算機來模擬數百個亞原子粒子的相互作用,比如歐洲核子研究中心的大型強子對撞機。這些模擬是緩慢的,需要巨大的計算能力支持。耶魯大學和勞倫斯伯克利國家實驗室的研究人員已經開發出一種GAN,在利用現有模擬數據進行訓練後,它能夠對特定粒子的行為做出準確的預測,而且速度要快得多。
此外,醫學研究是另一個非常有前景的應用領域,隱私問題意味著,研究人員有時無法獲得足夠的真實病人數據,分析為什麼藥物不起作用。賓夕法尼亞大學的凱西·格林(Casey Greene)說,GAN可以通過生成幾乎和真實情況一樣好的假病人記錄來幫助解決這個問題。這些數據可以被更廣泛地分享,有助於推進研究,而真正的記錄則受到嚴格的保護。
GAN擁有黑暗的一面 它們使問題變得更糟
然而,GAN也有黑暗的一面。對於那些想要影響股票價格、選舉結果等製造虛假新聞的人來說,被用於設計逼真假圖的機器堪稱是一件完美武器。這種AI工具已經被用來將其他人的頭像安放在色情明星的身體上,並將某些言論強加在特定的政客嘴上。GAN沒有製造這個問題,但是它們會使問題變得更糟。
在達特茅斯學院研究數字取證問題的哈尼·法里德(Hany Farid)正在研究更好的方法來識別假視頻,比如探測因吸入和呼出氣體而導致的臉部顏色發生細微變化,GAN很難精確模仿這些。但他警告說,GAN將會反過來適應這種情況。法里德說:「我們基本上處於弱勢。」
這種「貓捉老鼠」的遊戲也將在網路安全領域發揮影響。研究人員已經在強調「黑盒」攻擊的風險,在這種攻擊中,GAN用來找出大量安全程序發現惡意軟體的機器學習模式。通過推測某個防禦者的演算法工作原理,攻擊者可以躲開它並插入流氓代碼。同樣的方法也可以用來躲避垃圾郵件過濾器和其他防禦。
古德費洛深知其中的危險。現在,作為谷歌專註於讓機器學習安全的團隊負責人,他警告說,AI社區必須吸取以往創新浪潮的教訓,技術專家需要提前思考安全和隱私問題。以往,當他們意識到風險的時候,「壞人」已經確立了明顯的優勢。古德費洛稱:「很明顯,我們已經超越了起點,但希望我們能在安全問題上取得重大進展。」
儘管如此,古德費洛並不認為會有一個純粹的技術解決方案。相反,他認為,我們將不得不依賴於社會,比如教孩子們養成批判性思維,讓他們接受諸如演講和辯論課之類的東西。他說:「在演講和辯論中,你是在和另一個學生競爭,而你在思考如何製造誤導的言論,或者如何正確地製造那些具有說服力的聲明。」他很可能是對的,但他的結論是,技術不能解決假新聞問題,這不是很多人想聽到的。(完)
關注網易智能公眾號(smartman163),獲取人工智慧行業最新報告。
推薦閱讀:
※新氧放大招:AI幫你「策劃」一張適合自己的「臉」
※AI與安全
※瞄準短視頻紅海 「AI+內容」精準營銷引爆市場
※未來工作將面臨這4大轉變,AI首先淘汰的是舊工作思維
※日本用AI進行計程車調度:能準確預測需求,並幫助公司提高營業額