AI前線一周熱聞盤點：NIPS召開Black in AI會議；谷歌訓練CycleGAN可自行創建圖像

01-27

本文由【AI前線】原創，原文鏈接：http://t.cn/RTnQrVG

編輯｜Vincent

AI前線導讀：讓各位久等了！AI 前線周報升級歸來！

內容導讀：

Facebook 利用 AI 發現並幫助自殺人群
谷歌發布 TFGAN，旨在簡化 GAN 的訓練和評估過程
人工智慧機器人 Alisa 被提名為俄國總統候選人
AlphaGo 教學工具正式上線柯潔稱要「重新學圍棋」
北京市交委發布中國首個自動駕駛法規
谷歌公司研究人員訓練 CycleGAN 自行創建光學幻覺
利用 imgaug 生成合成訓練數據
谷歌公司利用機器學習探索索引結構
杜克大學，中科大等高校利用深度學習訓練 AI 以實現最優拓補結構
Andrej Karpathy：神經網路正在從根本上改變軟體
NIPS 召開 Black in AI 會議
艾倫腦科學研究所 AI 分部（簡稱 AI2）公布「THOR」3D 特工訓練環境

Facebook 利用 AI 發現並幫助自殺人群

Facebook 已經不僅僅是一個簡單的社交網站，正如他們之前在之前的項目中展示過的，他們推出了的新的自殺預防 AI。該功能可以在帖子和實時視頻流上使用模式識別，AI 能夠識別 Facebook 用戶是否有自殺想法。

模式識別不是一個新功能，它已經在 Facebook 的「第一響應者」計劃中使用。根據 Facebook 收到的主動檢測工作報告，該計劃已經完成了超過 100 次健康檢查。模式識別會查看諸如「你還好嗎？」和「你需要幫助嗎？」這樣的評論，然後這個信號會發送給 AI，之後 Facebook 員工會調查某個帖子或者直播。

新聞來源

https://en.softonic.com/articles/facebooks-improved-ai-uses-pattern-recognition-to-bolster-efforts-at-suicide-prevention

谷歌發布 TFGAN，旨在簡化 GAN 的訓練和評估過程

谷歌官方博客 12 月 12 日更新：為了使 GAN 更易於實驗，谷歌已經開源 TFGAN，這是一個輕量級的庫，旨在簡化 GAN 的訓練和評估過程。它提供了輕鬆培訓 GAN 的基礎設施，提供經過良好測試的損失和評估指標，並提供了易於使用的示例，突出了 TFGAN 的表達性和靈活性。同時谷歌還發布了一個教程，其中包含一個高級 API，可以快速獲取有關數據的模型。

新聞來源

https://research.googleblog.com/2017/12/tfgan-lightweight-library-for.html

人工智慧機器人 Alisa 被提名為俄國總統候選人民眾熱烈歡迎

由俄羅斯最大的網路網路公司 Yandex 開發的虛擬 AI 助手 Alisa，已被全國上萬支持者提名為下一任總統。俄羅斯總統普京是否會被 AI 取代？對特朗普總統失望的美國人民可能更希望投票給 AI 機器人吧，據《每日星報》報導，愛麗莎早已是家喻戶曉的虛擬助理，競選網站強調，Alisa 承諾將成為「最了解你的總統」。在過去的 24 個小時里，有超過 2 萬 5 千人在這個網站上投票提名 Aliss 為總統候選人。

Alisa 主要依賴邏輯運作，不會感情用事，不會謀求個人利益，也不會做出道德判斷。更棒的是，她可以 24 小時工作，智商是普通人類的 7 倍，能同時收到數百萬條建議，並永遠記住你。不過按照俄羅斯的法規，Alisa 明顯不夠候選資格，因為其誕生迄今仍不足一周歲，而法律規定候選人必須超過 35 歲。

據 Yandex 稱，Alisa 是由俄羅斯百萬富翁 Roman Zaripov 發起的。公司在一份聲明中表示「顯然，Alisa 被提名成為總統候選人此事是人們創造力最佳範例。我們和其他人一起了解到這一點」。

新聞來源

http://www.cnbeta.com/articles/tech/679809.htm

AlphaGo 教學工具正式上線柯潔稱要「重新學圍棋」

北京時間 12 月 11 日晚間，Deepmind 公司在自己官網上線了 AlphaGo 教學工具，旨在幫助公眾用新的、啟發性的方式下圍棋。這樣的舉措，也進一步兌現了 Deepmind 在烏鎮人機大戰結束時的承諾：與全世界圍棋愛好者共同分享 AlphaGo 的數據。

AlphaGo 的啟蒙老師、歐洲圍棋冠軍樊麾在微博上透露：「AlphaGo 教學工具共有兩萬多個變化，三十七萬多步棋組成，通過 AlphaGo 的視角，分析並建議圍棋開局的諸多下法。同時每步棋 AlphaGo 都會給出自己的勝率分析，希望 AlphaGo 對圍棋的獨特理解可以給我們一些啟發。」

隨後，當今世界圍棋第一人柯潔轉發此條微博，並評論到：「重新學圍棋。」

據樊麾介紹，此次公布的教學工具使用的版本是 AlphaGo Master。工具設有包括中文簡體在內的多個語言。

另據 DeepMind 官網介紹，教學工具分析了近期圍棋歷史裡 6000 個最受歡迎的開局，使用了 231000 盤人類數據，以及 75 盤 AlphaGo 與人類對弈的數據。

新聞來源

http://www.cnbeta.com/articles/tech/678817.htm

北京市交委發布中國首個自動駕駛法規

12 月 18 日，北京市交通委員會下發關於印發《北京市關於加快推進自動駕駛車輛道路測試有關工作的指導意見（試行）》和《北京市自動駕駛車輛道路測試管理實施細則（試行）》的通知。

《指導意見》中，包含對自動駕駛車輛上路測試工作的 基本原則、自動駕駛定義、責任主體、測試要求、測試管理以及事故責任認定。這是中國首次對自動駕駛車輛的測試工作出台了相關規定，對於專註於自動駕駛領域研究的國內企業來說，這是一個令人興奮的消息。

新聞來源：

http://www.bjjtw.gov.cn/xxgk/dtxx/201712/t20171218_189567.html

《自動駕駛的一大步！北京市交委發布中國首個自動駕駛法規》（插入鏈接：https://mp.weixin.qq.com/s?__biz=MzU1NDA4NjU2MA==&mid=2247487283&idx=5&sn=1a4f7b23a30d1fc932b0a0261ccd1eb8&chksm=fbe9b6fccc9e3fea7d486b3e9a40742fb35d5cd80421bc370e467212d98d025f375ffef4c800#rd）

以下新聞均來自 Import.AI，內容翻譯已獲得 獨家授權，未經許可，禁止轉載！

作者 Jack Clark 有話對 AI 前線的讀者說：我們對中國的無人機研究非常感興趣，如果您想要在我們的周報里看到更多有趣的內容，請發送郵件至：jack@jack-clark.net。

源自 CycleGAN 的意外隱寫方法:

…合成圖像生成器自行創建光學幻覺…

谷歌公司的研究人員已經確定了 CycleGAN 所使用的一系列驚人的信息存儲技術——這款工具可用於學習不同圖像集之間的對應關係，並生成合成圖像。具體來講，研究人員們發現，在 CycleGAN 訓練期間，其神經網路會將信息編碼添加至正在生成的圖像當，以幫助其立足合成源重建原始圖像。研究人員們寫道：「這意味著大部分與源照片相關的信息都會被存儲在所生成圖像的高頻低幅信號當中。」

CycleGAN 示例

這也意味著人們能夠利用 CycleGAN 創建惡意合成圖像，其中來自源圖像的干擾模式將致使神經網路重構出完全不同的圖像內容。研究人員們寫道，「我們發現 CycleGAN 正在學習一種編碼方案，其可在所生成的地圖 F x 當中『隱藏』與航拍圖 x 相關的信息。」

利用 imgaug 生成合成訓練數據:

…我們是否可以使用 CoarseDropout？也許再加點鹽和胡椒粉？以及仿射尺度演算法？…

在機器學習工作當中，最令人頭痛的部分之一無疑在於數據增強；所謂數據增強，是指立足已經收集到的現有數據集——例如貓的照片集，並通過多種方式進行圖像轉換以擴展數據集大小。Imgaug 這款新型免費軟體能夠自動完成這一過程，為用戶提供大量可能的轉換成果，並自動應用於相關圖像。

作者寫道，「其支持各種各樣的增強技術，可輕鬆將這些技術結合起來，且提供簡單而強大的隨機介面，可增強圖像與關鍵點 / 標誌並在後台進程中提供增強功能，從而進一步提升成效。」

訪問此鏈接閱讀 imgaug 說明文檔。

http://imgaug.readthedocs.io/en/latest/

訪問此鏈接在 GitHub 上查看 imgaug。

https://github.com/aleju/imgaug

我搞不定二叉樹：谷歌公司利用機器學習探索索引結構

…再見了，傳統軟體；你好，深度學習軟體…

自從深度學習技術從根本上改變了計算機所能夠實現的感官識別與分析能力之後，這種能力被引入軟體產品本身顯然只是時間問題。來自谷歌公司的一篇最新研究論文展示了如何利用現代人工智慧方法顯著提高計算機科學當中一大基礎性任務的技術水平：為大型數據存儲庫建立索引系統。

在這份論文中，研究團隊展示了如何基於「已學習索引」構建神經網路，並利用其替代傳統的二叉樹類索引。未來，該團隊還計劃嘗試利用這項技術編寫插入操作以及其它基本資料庫演算法，例如與添加及排序數據相關的演算法。

這支谷歌小隊在四大數據領域對自己的方法者測試：來自谷歌自身系統的實際整數數據集（具體分為地圖與網路日誌）、包含「1000 萬非連續性文檔 ID」的各大型互聯網企業實際產品 Web 索引，以及一套名為 Lognormal 的合成數據集。

結果：研究人員們寫道，「機器學習型索引幾乎涵蓋了二叉樹索引的所有配置方式，且可帶來 3 倍速度提升與高達一個數量級的『瘦身』效果。當然，如果不介意解壓所佔用的 CPU 資源，用戶也可以對二叉樹索引進行進一步壓縮。更值得強調的是，這些優化不僅大多屬於正交關係，且對神經網路而言還存在著更多壓縮潛力。例如，神經網路能夠利用 4 或 8 位整數——而非 32 或 64 位浮點數——來表示模型參數。」他們目前的實現方案依託於 CPU，但未來研究人員們相信 GPU 與新的專門面向 AI 用例的 TPU 將可進一步實現運行提速。

對實用性抱有懷疑：谷歌公司的研究人員們在報告中指出，像這樣的方法需要耗費大量計算資源才能夠實現。不過考慮到 TPUS、Cerebras 以及 Graphcore 等的存在，這樣的設計思路似乎也完全能夠理解。但仍有人對論文內容抱有懷疑。Symas Corp 公司 CTO Howard Chu 在郵件中指出，「其中假定一套靜態數據集以吟詩方式使用，這顯然不適用於需要即時進行修改的目錄或資料庫。另外，其假定整個數據集存在於內存當中，這對於資料庫類應用程序而言通常並不現實。具體來講，論文假定使用高並發 GPU 資源並將一切塞進顯存以建立『快』用例，但顯存容量甚至要比伺服器主內存還更加緊張。」

學習型網路拓撲，實現最優拓撲結構

其目標在於「讓一切輸入與輸出對實現自動化」…

來自杜克大學 / 中國電子科技大學 / 布朗大學 /NEC 實驗室的最新研究結果，展示了如何利用深度學習方法進行人工智慧策略訓練，從而利用 DeepConf 軟體預測適合數據中心實際需求的最佳網路拓撲結構。這項研究最令人感興趣的一點，在於其再次證明了近期得到廣泛關注的、將輸入與輸出進行重新匹配的趨勢（例如確保數據包以特定最佳拓撲方式流入數據中心，或者利用圖像像素生成標籤，或利用音頻波形實現語音轉錄等）。最終，也許我們所熟知的一切都將由強大的 AI 技術與工具進行重新評估。

先是視覺領域，後是數字化領域——AI 分析主宰一切

…神經網路正在全面滲透現實世界…

軟體 2.0：數周之前，Andrej Karpathy（此供職於斯坦福 /OpenAI，目前就職於特斯拉公司）曾表示他認為神經網路正在從根本上改變軟體，並認定這將最終帶來軟體 2.0——即神經網路生成型軟體的專有品牌。

Andrej Karpathy

Karpathy 寫道，「事實證明，對於大部分真實世界問題而言，收集數據在難度上都要遠低於編寫程序。未來，大部分程序員將不必維護複雜的軟體庫、編寫錯綜複雜的程序或者分析其運行時間。相反，程序員們只需要收集、清理、操縱、標記、分析以及可視化來自神經網路的數據。」

這項來自谷歌的研究結論，外加上周公布的多份化學論文以及神經架構搜索等技術的持續創新，都為我們提供了經驗依據，證明人們已經開始重新思考利用 AI 進行軟體設計的作法，並著手探索現實世界能夠因此獲得怎樣的助益。作為發展的下一階段，我們將重新思考優化型計算機運算如何同 AI 進行協作。不過在我看來，人們還沒有考慮到因此出現的 bug 問題該如何解決。

NIPS 召開 Black in AI 會議：

今年，NIPS 方面召開了「Black in AI」會議，來自 DeepMind 的研究人員 Simon Osindero 作出演講。本次演講主要涉及 AI 社區所需要解決的一系列棘手問題，具體包括包容性與偏見問題，外加社區該如何改進自身代表性等。

Simon 指出，「我們完全可以利用各自不同的背景為整個人工智慧領域帶來更為廣闊的觀察視角。希望我們能夠通過這種方式，確保我們所開發出的人工智慧應用及系統不會殘留一些社會上仍然存在的偏見問題，最終幫助其變得更為公平、透明且負責。」

來自 Simon 的小故事： 2015 年當我前往蒙特利爾參加 NIPS 時，我與其他人一樣在眾多 AI 會議之間不斷找機會跟同僚們暢飲到深夜。到了星期五早上，報應終於來了，我不得不勉強從床上爬起來去參加一次強化學習研討會。進入現場後，我發現 Simon 正精氣神十足地坐在我前面的椅子上。我問他：「Simon，我覺得好累，你是怎麼做到的？」他舉起一個布洛芬藥瓶，解釋稱「每一次科學革命，都建立在前一次科學革命的基礎上。」

艾倫腦科學研究所 AI 分部（簡稱 AI2）公布「THOR」3D 特工訓練環境：

…交互之家（The House of inteRactions，簡稱 THOR），這裡危機重重、但這裡又獎勵豐厚…

AI2 方面公布了 THOR，一套基於 Unity 3D 遊戲引擎的 AI 模擬環境。THOR 當中包含超過 120 個「逼真的 3D 場景」，由人類藝術家手工建模（不同於更為常見的程序化生成環境）。THOR 環境中可以包含眾多所謂「可操作對象」，其中每個對象都能夠實現「交互」。換句話來說，特工人員可以粗略對這些目標進行操縱以改變其狀態，比如將一具物體放進另一個物體當中，或者開啟及關閉櫥櫃與抽屜。

高質量場景：論文指出，THOR 場景的高視覺逼真度使得「學習模型得以更好地被轉移至現實世界之內」。在此之前，THOR 已經開始為眾多項目提供支持，包括在模擬環境下訓練遙控車操作。目前的模擬到現實技術已經相當多樣，包括「域隨機化」等，可輕鬆實現低保真度模擬並通過數據增強將模型轉化為現實場景。

3D 環境的無限擴張：過去幾年以來，已經出現一系列新的大規模 AI 訓練環境——包括微軟基於《我的世界》的 Malmo、DeepMind 基於《雷神之錘》的「DeepMind Lab」，以及基於《毀滅戰士》的 VizDoom。觀察遊戲引擎的選擇會給這些 AI 訓練系統的最終設計與參數帶來怎樣的影響，確實是個有趣的過程。因此，我期待著能夠在 AI 研究領域看到更多 Unity 或者其它引擎的出現。

技術故事：

Clown Hunt：當人們聽說我的工作是進行人工智慧研究，他們大多會想到圖靈測試以及 Voight-Kampf 測試等等。但請相信我，這些測試根本沒用。我們嘗試過對話方式，也已經開始利用虛擬現實場景進行對話——包括進行一切必要的探索。但這一切都無法奏效。大家可以將場景設想成在《半條命 2》中使用附加組件，而軟體的任務在於搭建出「可玩」的環境，例如將大量物品及人物、外加可編程活動共同添加到一個已經具備物理效果與動力學原理的世界當中。人們確實玩得非常開心，比如製作一門大炮，用它轟擊汽車！或者使用反重力槍來製作一個上下顛覆的游泳池，要麼就是把過山車裡的全部乘客都替換成橡膠鴨子之類。

而這基本就是目前的 AI 測試方法。儘管人們一直希望人工智慧擁有出色的對話能力，但其距離終結者或者仿生人還有很遠很遠的距離。相反，其目前的能力僅僅是測試網路上的軟體，同時分辨哪些程序源自人類操控、哪些源自軟體自身等等。這種低下的反應性正是問題所在。如果某些事物會快速變化，那麼我們恐怕很難對其進行處理。為了解決這一挑戰，我們開始組織各類技術競賽——各種非營利性組織及企業都在進行此類嘗試。參賽者們可以利用大量計算資源完成競賽，而他們一旦勝出，我們會為其提供獎品，並對相關程序進行更為深層的測試。

我的工作是發現這些不受管制的「認知級」軟體系統，具體方式就是投身於模擬器當中並進行操作。我有兩個孩子，所以我對人類的表現具備一定了解——我認為其中最特別的就是關於「有趣」的感受。這種感受是計算機很難獲得的。因此，我們可以通過構建最有趣、最激動人心或者最能引起共鳴的事物來判斷對方是人類抑或人工智慧。我的妻子說，我這樣的性格如果生活在古代一定會是個童話作家。但現在的我卻在負責檢測另一種「大腦」——且同樣需要讓自己保持一顆童心。

因此，今天我的工作是嘗試讓一群呱呱叫的鴨子引領一台烤麵包機穿過馬路，且避開路上的「汽車」——實際上是上周末我和孩子們精心設計的金屬鯨魚。鴨子頭頂有一道雷電，還在劈啪作響。通過編程，這些鴨子能夠用嘴輕輕推動烤麵包機，慢慢讓它通過這條布滿鯨魚的道路。

接下來，我將目光投向軟體的開發成果——真是令人稱奇。它用金屬梁構建起一座樹屋——結構非常標準，但在樹屋的頂部擺上了桌子和幾位客人。這裡說「客人」似乎並不準確，因為其只是一些超大尺寸、解析度很高且精心製作的蜂蜜烤火腿，上面還瀰漫著一些熱騰騰的「數字化」香氣。其中一個火腿在上三分之一處粘有一條假鬍鬚，右上方則是一塊單片眼鏡——恰好是人類眼睛的位置。這樣的畫面有點像我在夢中才會看到的情景。因此很明顯，我發現這是一種認知類工作。以往我一直覺得計算機搞不懂「有趣」是什麼意思，但現在我的觀念動搖了——也許它已經從我這裡學到了一點自娛自樂的本事。

相關技術：

Kaggle、《半條命 2》、遊戲 Mod、模仿學習、元學習、人類偏好學習。

關注我們的微信號"AI前線"，後台回復「AI」可獲得《AI前線》系列PDF電子書