阿爾法狗60連勝橫掃,顛覆性的人工智慧時代即將到來? | 探秘谷歌DeepMind

阿爾法狗60連勝橫掃,人類最後一次贏棋已成歷史來源:知社學術圈(zhishexueshuquan)2016年,人工智慧首次戰勝了圍棋頂尖高手。只是當時沒有人意識到,這一年,也是人類棋手最後一次在阿爾法狗身上贏得一盤棋。人類幾千年的智慧結晶,面對人工智慧短短一年的培訓,不堪一擊。在剛剛結束的非正式測試中,阿爾法狗60連勝。人類的唯一機會,就是掉線、或者拔電源了。不知道這樣的局面還能維持多久。

2016年12月29日,弈城圍棋網出現一位名為「Master"的神秘棋手,並在2017年1月1日晚轉戰至騰訊的野狐圍棋。Master以每天十盤的速度快棋挑戰中韓日的頂尖高手,接連戰勝柯潔、朴廷桓、井山裕太等世界頂級棋手,引起巨大的轟動和對於屏幕背後其真實身份的各種猜測。2017年1月4日晚,Master在戰勝韓國天才棋手申真諝,中國名將常昊、和世界冠軍周睿羊,取得59連勝之後,亮出了自己的身份:

Master就是Google DeepMind的阿爾法狗! 隨後Master與古力下了最後一盤棋,以60戰全勝橫掃人類,結束了這次測試。

DeepMind的聯合創始人和CEO Demis Hassabis隨即發布推特,證實Master的確就是阿爾法狗新版原型,並透露將在今年和人類頂尖高手慢棋正式過招。而僅僅在半年多前,對阿爾法狗並不服氣的柯潔,這次連輸兩盤,竟致一夜無眠:

最後可能因為壓力過大而住院:

而同樣輸棋的聶衛平,則更富哲理:Master改變了我們傳統的厚薄理念,顛覆了多年的定式。。。看了40多盤Master對年輕高手們的對局,深感當年日本名譽棋聖藤澤秀行老師說的那句話『棋道一百,我只知七』是何等地深刻貼切!在看似不能出招的地方出招,而且最後證明它的選擇都成立,都不是錯的!。。。這隻能說明,圍棋遠不像我們想像的那麼簡單,還有巨大的空間等著我們人類去挖掘,阿法狗也好,Master也罷,都是『圍棋上帝』派來給人類引路的。阿爾法狗到底有多強? 看看下面這張圖表就知道了,是DeepMind去年Nature文章第一作者David Silver所示。人類最高等級分大概是3600,也就相當於AlphaGo第15代。而且阿爾法狗第18代,等級分已經高達4500。要知道根據Elo等級分公式,「勝率= 1/(1+10^m) * 100%」,其中m是兩選手之間Elo等級分差/400。所以高100勝率為64%、高200為76%、高300為85%。

那高900分呢? 勝率為99.4%!人類還有機會么?可這還不是最可怕的。最讓人絕望的是,據說阿爾法狗最新的版本已經是第25代!每代之間呢,差300分!顯而易見,2016年是人類最後一次在阿爾法狗身上贏一盤棋。

阿爾法狗主要工作原理是基於多層人工神經網路的深度學習。一層神經網路把大量矩陣數字作為輸入,通過非線性激活方法取權重,再產生另一個數據集合作為輸出。這樣通過合適的矩陣數量,多層組織鏈接一起,形成神經網路「大腦」進行精準複雜的處理。這些網路通過反覆訓練檢查結果,進而校對調整參數,因此更多的訓練後能讓它進化到更好。這也是其每一代都進步神速的原因。不過人類也不是完全沒有機會。這次測試,實際還是和一盤棋的。陳耀燁在和Master下了七手棋後掉線,被判和棋。論小聰明,人工智慧恐怕還差很遠。不過總有一天,當人工智慧的大腦結合機器人的體魄的時候,恐怕插頭就不是人類想拔就能拔的了。。。谷歌的DeepMind探秘來源:經濟學人(ID:TheEconomistGroup)研發出AlphaGo的DeepMind給谷歌帶來的最大價值,是提供一家智能的演算法工廠。它將遠不止是這家科技巨頭的人工智慧技術的長遠研究機構及人才儲備庫,打造演算法從各種大數據集中獲取知識對谷歌而言意義更大。《經濟學人·商論》2017一月刊,帶你探究谷歌收購的這家人工智慧科技公司的秘密。人工智慧谷歌的海馬體Alphabet已擁有大量人工智慧專門技術,為何還需要DeepMind?

人工智慧(以下簡稱AI)科技公司DeepMind的辦公室藏身於倫敦國王十字火車站旁邊一座不起眼的建築物內,從外看去,完全不像是Facebook和谷歌這兩大科技巨頭爭相收購的對象。最終,谷歌勝出,在2014年1月以4億英鎊(6.6億美元)成功收購了DeepMind。但谷歌當初為何要收購這樣一家英國AI公司呢?在機器學習及與之相近的AI技術方面,谷歌早已走在前列。DeepMind能給谷歌帶來什麼價值?這個問題現在變得更迫切了些。2015年10月之前,谷歌的巨額廣告收入為DeepMind這類雄心勃勃的零收入項目提供了充足的庇蔭。而後谷歌構建了名為Alphabet的母公司架構,並成為公司旗下唯一盈利的公司。其他業務的綜合營收首次從谷歌的資產負債表中拆分出來,因而會受到更多審視。但要了解DeepMind的價值所在並非一個簡單的財務問題。其意義更為深遠。DeepMind對谷歌和Alphabet最直接的好處是使其在科技公司圍繞AI展開的戰略競爭中處於有利位置(見圖表)。它吸納了眾多人才,令Facebook、微軟、亞馬遜等競爭對手對其研究人員求之而不得。公司在國王十字火車站旁的辦公樓內現有約400名計算機科學家及神經科學家,據說規模將擴至1000人。

DeepMind為母公司帶來的另外一個好處是聲望的提升。被收購後,DeepMind已兩次登上權威學術期刊《自然》的封面,相關封面的巨幅複製品就張貼在公司大堂的牆上。首次登上封面是因為一款能玩電子遊戲的AI程序,第二次則是由於一款學會了下古老的亞洲棋盤遊戲圍棋的程序。這一以母公司名字命名的軟體AlphaGo在2016年3月擊敗了韓國圍棋冠軍李世石(如圖),一舉登上世界各地的新聞頭條。然而,DeepMind的眼光遠不止於吸引人才和公眾關注。其CEO及聯合創始人德米斯·哈薩比斯(Demis Hassabis)將公司描述為一種新型的研究機構:既擁有學術領域的長遠眼界,也具備「科技創業公司的活力和專註」,而Alphabet的資金就更不用說了。哈薩比斯在2010年與穆斯塔法·蘇萊曼(Mustafa Suleyman)和謝恩·列格(Shane Legg)一起創立了DeepMind。列格與哈薩比斯在倫敦大學學院(University College, London)從事神經科學研究時相識,蘇萊曼則是哈薩比斯兒時的玩伴。正如哈薩比斯所說,公司的整體使命是「解密智能」。這將使公司創造能像人類那樣廣泛高效思考的多功能「通用型」人工智慧。公司接受谷歌收購有幾個誘因。一是可藉此獲得谷歌的計算能力。另一個則是谷歌的盈利能力:如果是由財力較弱的買家來收購,則更可能對DeepMind設下盈利要求。而谷歌沒有這樣的要求,哈薩比斯便可專註於研究,而非公司的運營細節。通過把DeepMind留在倫敦,與谷歌位於山景城的矽谷總部保持一段安全距離,他還可以對運營保留更大的控制權。假如他成功實現了通用AI技術,顯然將會為Alphabet帶來巨大的價值,等於為之提供了一名可以被無窮複製的數字化員工,用於解決各種問題。但DeepMind的研究計劃並不是——或者說尚未成為——一種商業模式,而且其未來規劃極為長遠。哈薩比斯表示公司正在執行一個20年期的規劃。他補充道,DeepMind的目標是發明類似人腦運作方式的AI新演算法。正因如此,公司聘用了大批神經科學家。哈薩比斯聲稱,從人腦尋求靈感使DeepMind大大有別於其他機器學習研究團隊,尤其是「深度學習」這一正為「谷歌大腦」團隊使用的機器學習的強大分支。即便DeepMind從來都沒研發出達到人類水平(或甚至超人類)的人工智慧,但在研究過程中創建的學習軟體仍可為Alphabet的其他業務帶來好處,而且效果已經顯現。今年七月,公司宣布其學習軟體已找到方法將谷歌數據中心的製冷用電量減少五分之二。該軟體先是分析數據中心的操作日誌來理解任務,然後通過反覆模擬運行來優化過程。DeepMind也在應用AI研究來自主解決問題。主管這些工作的蘇萊曼曾表達過此種抱負:希望DeepMind能幫助管理能源基礎設施,完善醫療保健系統,改善潔凈水的供給,以此開拓公司的收入來源。DeepMind已經啟動了醫療保健方面的工作。今年11月,公司獲得了首個付費工作,與NHS公立醫院皇家自由倫敦醫院(Royal Free London)簽下五年的合同,為其處理170萬份病歷。今年早前,DeepMind從倫敦其他醫院獲得了兩組數據集:100萬份視網膜掃描圖,可從中挖掘並辨別出退行性眼病的早期徵兆;頭頸部癌症病例的醫學影像,可輸入到DeepMind的模型中,讓其AI系統學習區分健康和癌變組織。神經網路在延展熟練的程序員及強大的計算機是這類應用型AI業務的關鍵,不過獲取現實世界的數據也至關重要。運用AI及機器學習技術改進醫院、電網及工廠等系統時,獲取其具體操作數據是必需的。當然,在這些方面,Alphabet公司擁有大量數據可供挖掘,但DeepMind必須還要從其有意探究的各個領域獲取更多數據。例如,最近它參與一個關於唇讀的項目之所以取得成功,就是因為獲得了前所未有的大數據集。由計算機視覺專家安德魯·基澤曼(Andrew Zisserman)帶領的一組牛津大學的科研人員負責了該項目。BBC向這些研究者提供了數十萬小時的新聞播音員錄像。沒有這些數據,他們就無法訓練其AI系統。關於數據採集之於DeepMind未來的重要性,哈薩比斯輕描淡寫地表示,人類工程師只要能就有待解決的問題構建模擬情境就足夠了,然後DeepMind便可將學習主體置於這些模擬情境中。但目前運行的大多數機器學習系統並非如此操作。AlphaGo本身就是先在收錄了16萬盤人類棋局、包含數百萬著棋的資料庫中學習之後,才反覆自我對弈訓練,加以改進。不過,DeepMind如果真的需要掌握大量個人信息,就必須解決消費者對於企業獲取數據的顧慮。但如果這些問題得到解決,DeepMind將為Alphabet帶來巨大的價值,成為其一個全新的部分:一家演算法工廠。這樣一來,DeepMind將遠不止是該科技巨頭的AI技術長遠研究機構及人才儲備庫。DeepMind處理的數據的所有權可歸其來源機構(這應有助於減輕人們對隱私外泄的擔憂),但通過學習這些數據而打造出的軟體將屬於Alphabet。DeepMind自己運用AI程序解決複雜問題也許永遠賺不了大錢,但學習軟體從那些數據集中獲取的知識卻意義重大。科技巨頭們掀起收購戰,Alphabet把DeepMind納入麾下,原因或許就在於此。

DeepMind回顧2016年:肯定成就,提出三大發展方向來源:機器人2025(ID:robot2025),作者:何雅琴谷歌(微博)旗下DeepMind團隊本周在官方網站上撰文,回顧了2016年所取得的進展。展望2017年,DeepMind提出了三大發展方向:實現演算法突破、提升社會影響,建立道德倫理規範。

以下為文章全文在當前世界中,無論是天氣還是征服疾病,我們都面臨著非常複雜、緊急、難於掌握的系統。我們認為,智能程序將有助於挖掘新的科學知識,給社會帶來幫助。為了實現這一目標,我們需要通用的學習系統,從頭開始建立起對問題的理解,並利用這些去識別模式,取得其他方式無法獲得的突破。在DeepMind,這是我們長期研究使命的焦點。儘管距離我們設想的智能還有很遠的距離,但2016年是重要的一年。對於多項核心挑戰,我們取得了令人興奮的進展,而我們也首次看到了人工智慧對現實世界可能的積極影響。我們的程序AlphaGo挑戰並擊敗了世界圍棋冠軍李世石,而相關論文很幸運地讓我們第二次登上了《自然》雜誌的封面。許多專家認為,這一成就比預期中提前了幾十年。對我們以及全球圍棋社區來說,最令人興奮的是,AlphaGo展示了贏得比賽的創造性,在某些情況下甚至找到了挑戰數千年圍棋智慧的下法。

對於史上最複雜的遊戲之一,AlphaGo探索並分享了新思路,這表明了人工智慧未來某天可能帶來的價值。我們期待2017年能去完成更多遊戲。我們在生成模型領域也取得了有意義的進展,這樣的軟體能自主想像新的結構和場景。在發表關於圖像生成的PixelCNN論文之後,我們發表至WaveNet的論文展示了生成音頻的有效性。我們通過原始的波形合成了全球最近似真人的語音,而不是將語音樣本簡單地拼接在一起。我們計劃與谷歌合作將這項技術產品化,並且很高興這項技術能給數千萬人使用的產品帶來優化。另一個重要研究領域是記憶和存儲,尤其是如何將神經網路的決策能力與複雜結構化數據的存儲和推理能力結合在一起。我們憑藉「可微分神經計算機」在18個月內發表了第三篇《自然》論文。這種模型能同時像神經網路一樣學習,以及像計算機一樣記憶數據。這樣的模型能學習如何回答關於數據結構的問題,無論是族譜還是地鐵線路圖。這意味著我們更接近利用人工智慧通過複雜數據集完成科學發現的目標。除了推動這類系統用於更多場合,我們還投入了大量時間,優化系統的學習方式。一篇題為「無監督輔助任務的增強學習」論文描述了將某些任務學習速度提升多個數量級的方法。考慮到高質量訓練環境的重要性,我們向整個社區開源了旗艦的DeepMind Lab研究環境。我們也在與暴雪合作,開發用於《星際爭霸2》的人工智慧訓練環境。當然,這些只是冰山一角。通過我們今年在頂級刊物,例如《Neuron》和《PNAS》,以及主流機器學習會議,例如ICLR和NIPS上發表的論文,你可以了解到我們的更多工作。我們很高興看到,社區中的其他參與者正在這些論文成果的基礎上積極部署和開發,例如2016年晚些時候圍棋程序的再次興起,以及人工智慧和機器學習在更廣泛的領域快速發展。我們也很高興看到,這類工作對現實世界的初步影響。我們與谷歌數據中心團隊展開了合作,利用類似AlphaGo的技術發現創造性的新方法管理散熱,使樓宇能效大幅提升了15%。如果這類技術可以被用於其他大規模工業系統,那麼將很可能給全球環境和成本帶來幫助。這只是我們與谷歌多支團隊合作,將先進研究用於全球產品和基礎設施的一個案例。與此同時,我們也在積极參与與英國兩家NHS(全國醫療系統)醫院的機器學習研究合作,探索我們的技術如何帶來更有效的診斷,以及對影響全球數百萬人的癥狀的治療。我們還與另兩家醫院集團就移動應用,以及基礎性設施展開合作,給醫療帶來優化。當然,這類技術對社會的積極影響不僅僅是我們正試圖解決的現實世界問題,也包括演算法和模型的設計、訓練和部署方式。我們很自豪,能參與創立Partnership on AI項目。這一項目將領先的研究實驗室、非營利的民間社會團體,以及學術機構聯合在一起,在演算法透明度和安全性等方面制定最佳行為規範。通過體驗信息的多樣化,我們希望能協助解決這些挑戰,找到方法將社會目標置於全球人工智慧社區的中心。我們還是一家很年輕的公司,我們剛剛開始踐行我們的使命。2017年,我們想做這三件事:實現演算法突破、提升社會影響,建立道德倫理規範。如果我們做到了這些,我們就能離我們的使命更進一步,我們將繼續為科學界乃至世界貢獻我們自己的力量。原文鏈接:https://deepmind.com/blog/deepmind-round-up-2016/

DeepMind對谷歌的戰略價值

Deepmind位於倫敦國王十字火車站附近一棟不起眼的樓房中。從外部看,一點都看不出來這家公司有什麼特別之處,值得谷歌和Facebook爭相購買。2014年1月,谷歌勝出,以6.6億美元買下了這家AI公司。在此之前,谷歌在機器學習和AI領域已處在最前沿的位置,為什麼要大費周章地購買位於英國的AI公司?Deepmind究竟會帶來怎樣的價值?12月中旬,《經濟學人》雜誌撰文深度剖析了人工智慧公司DeepMind對谷歌的價值。DeepMind帶來的最直接利益是,讓谷歌和Alphabet在全球科技公司的AI爭奪戰中擁有了戰略優勢,這有助於吸納AI人才。「阿法爾狗」因打敗世界圍棋冠軍李世石而出盡風頭,谷歌因此贏得更大聲望。如果DeepMind能夠成功研製出通用型AI,這等同於創造了一種可不斷複製的數字化員工,並用於解決各種問題。哪怕DeepMind無法研製出等同於或超越人類水平的人工智慧,它已取得進展的AI學習軟體也有利於其它業務,例如,通過減少電耗而節約開支。2015年10月之前,谷歌的巨額廣告收入讓DeepMind等項目可以無後顧之憂地自如發展。這些項目野心勃勃,但在收益上卻顆粒無收。但後來母公司Alphabet創立,整個企業的架構經歷了劇變,資產負債表開始分賬計算,許多業務被獨立出來,再無法依賴谷歌這棵搖錢樹的庇蔭了。在這種形勢下,為何購買Deepmind這一問題就值得探討了。但理解DeepMind的價值並不是一個簡單的金融問題,而需從更深的層次來分析。DeepMind帶來的最直接利益是,讓谷歌和Alphabet在全球科技公司的AI爭奪戰中擁有了戰略優勢,這有助於吸納AI人才,讓Facebook、微軟和亞馬遜等競爭對手在研究人力上失去一定優勢。DeepMind已招攬大約400名電腦科學家和神經系統科學家,據稱團隊規模還將擴大到1000人。

此外,Alphabet也因DeepMind而贏得更大聲望。被收購後,DeepMind兩次登上《自然》的封面,一次是由於一個視頻遊戲AI程序,另一次則是由於AI軟體「阿法爾狗(AlphaGo)」。《自然》是一份獲得高度好評的學術期刊。DeepMind公司大廳的牆上貼著這兩次封面圖片的大幅複製品。2016年3月,「阿法爾狗」打敗了世界圍棋冠軍李世石而成為大量媒體的頭條新聞。DeepMind的戰略意義還遠不止於人才吸納和公眾關注兩個方面。CEO兼聯合創始人德米斯-哈撒比斯(Demis Hassabis)把DeepMind描述為一種新型的研究機構,結合了學術界的長遠眼光以及「科技初創公司的活力和專註」。2010年,他與穆斯塔法-蘇萊曼(Mustafa Suleyman)和施恩-萊格(Shane Legg)一同創建了公司。萊格和哈撒比斯同為倫敦大學學院的神經科學研究者。蘇萊曼是哈撒比斯童年時結識的好友。DeepMind受益於谷歌的強大資源和雄厚財力據哈撒比斯的描述,DeepMind的總目標是「攻克智能領域的難題」。這促使公司不斷研發多功能的、能夠像人類那樣廣泛和高效思考的「通用型」人工智慧。被谷歌購買擁有幾大吸引之處。一是,能夠獲得谷歌強大的計算資源。再者,谷歌的財力雄厚。如果實力較弱的公司購買了DeepMind,很可能要求它儘快生錢。在谷歌旗下做事,哈撒比斯就能夠更專註於研究,而不是運營公司。而DeepMind辦公地點和過去一樣依舊設在倫敦,與谷歌的矽谷總部之間保持安全距離,讓他能夠對DeepMind擁有更多的實控權。如果他能夠成功研製出通用型AI,這明顯對Alphabet意義重大。這等同於創造了一種可不斷複製的數字化員工,並用於解決各種問題。從總體研究日程來看,DeepMind並不是一家以商業模式運作的公司。它的研發周期相當長。哈撒比斯的藍圖規劃長達20年.DeepMind希望在人腦運作方式的啟示下發明新型的AI演算法。這也是它擁有龐大的神經科學家團隊的原因。哈撒比斯聲稱,從人腦中獲取靈感使DeepMind截然不同於其它專註於機器學習、尤其「深度學習」的研究機構。深度學習是機器學習的一項重要分支,也是Google Brain項目的研發焦點。哪怕DeepMind無法研製出等同於或超越人類水平的人工智慧,它已取得進展的學習軟體也有利於Alphabet的其它業務。16年7月,公司宣布,DeepMind研發的學習軟體已經找到方法以節約用於冷卻谷歌數據中心的電力,節約幅度達五分之二。該軟體把數據中心的操作日誌進行壓縮,並以模擬形式反覆執行壓縮任務以實現過程的優化。


推薦閱讀:

玩家的性智慧
透過2017中國智慧餐飲報告 研判2018智慧餐飲發展趨勢|附報告
智慧樹
不可不學的職場智慧
掌紋圖解(之)智慧線匯總

TAG:人工智慧 | 智慧 | 時代 | 探秘 | 顛覆 | 谷歌 | 人工 | 阿爾法狗 |