如何評價 Nature 重磅封面:谷歌人工智慧擊敗歐洲圍棋冠軍,3 月將與李世石對弈?

新聞鏈接
Nature重磅封面:谷歌人工智慧擊敗歐洲圍棋冠軍,3月將與李世乭對弈
Nature原文
http://www.nature.com/nature/journal/v529/n7587/full/nature16961.html


一直想對這個事情寫點東西,以下都是個人理解,沒有任何資料印證
智能是什麼?圖靈定義的人工智慧是輸入輸出系統,當輸出跟人的輸出相同(或者說不可區分)時就是人工智慧。我覺得可能還不太完整,如果把一個程序放進黑屋子裡,沒有人去輸出的時候程序就進入等待了;而把一個人關進黑屋子裡,沒有人輸入的時候,這個人會自己用電腦上網學習新知識,或者去打dota。所以第二天再去聊相同的內容的時候,就會發現這個黑屋子主人獲得了某些新的知識。這並不是說圖靈測試失效了,而是說如果這些特性也是圖靈測試的一部分,也就是說有個測試例:

「你知道莎士比亞嗎?」
「不知道。」
「你去查一下相關資料,明天我們聊。」

第二天
「你知道莎士比亞嗎?」
「我昨天查了,莎士比亞是……」

也就是說真正的智能是個閉環工作的過程,並不會因為輸入的停止而停止。這個過程大致可以表述為:
採集 -&> 預測 -&> 決策 -&> 執行
的循環。採集是指從環境中收集信息。預測是指:如果我採取XXX行動,會有什麼樣的結果?決策是指:在可能採取的所有行動中,哪一種是最有利的?執行就是執行這一種行動。在執行之後,外部環境會有變化,重新進行採集,進而產生行動循環。
很容易發現下棋就是這種循環的典型代表。在這四步操作中,採集和執行一般比較簡單,核心是預測-決策模型。人的智能也可以參考這個模型。

人和機器有什麼不同呢?採集和執行上幾乎是相同的,主要在於預測-決策模型。人的預測-決策可以分為三類:
1. 本能
脊髓反射、條件反射等等,不需要經過思考。雖然看上去很低端,但是其實可以完成很複雜的任務,比如說人臉識別等等
2. 理性
推理、計算,概率模型,任何能夠說明道理、寫成論文的過程。
3. 經驗
雖然都反對經驗主義,但我認為經驗才是人的決策模型里最重要的一部分,也是人隨著年齡累積智力上最重要的成長。比如說一道數學題要用什麼樣的思路去解決?一個科研任務應該用什麼思路去著手?這些問題本身是很難用理論來描述的。

這三種模型里,理性其實是計算機擅長的部分,比如說象棋的棋盤推演,數學體系的形式化的推導,可以以遠超過人類的速度進行運作。本能是人特有而計算機不具備的,是人的天生優勢。而深度學習補足的就是「經驗」的部分。

所以為什麼說這次圍棋上戰勝人類,意義要遠比象棋戰勝人類強。以前的人類和機器的對決,機器的武器是「理性」,人類的武器是「經驗」。而這是第一次機器用「經驗」戰勝了人類。這意味著原來只能依賴人類的很多任務也許機器都會更加勝任。

那麼本能呢?
實際上研究已經表明,類似於人臉識別的問題,統計模型和深度學習(尤其是後者)都有不錯的識別率。這意味著很大程度上本能可以經過巨大的訓練量,由「經驗」來模擬。

那麼實際上能夠擋住AI成為人的門檻已經不存在了。如果說還存在,也就是如何讓AI在所有方面上都達到人類程度的閱歷,畢竟AI現在還只是個只會上網(爬蟲)的宅男。

除此以外,AI還需要一個終極的目的。有目標才能進行決策。人的目的是什麼?也許是「愉悅」,因為快樂所以活著,因為快樂所以享受美食和男歡女愛,等等。AI的目的則可以通過編程確定,所以AI可以比人更專註。如果這個目的出了偏差,也許天網毀滅人類真的會成為現實。

人的「經驗」只能累積一百年,而AI的經驗可以累積上千年,如果深度學習真的沒有極限(目前還看不到真正的極限)的話,AI總有一天會全面超越人類。當然那還得是非常久之後的事情。在專業領域上,AI大概會很快就戰勝人類了,比如說圍棋。


AlphaGo的發布,是一個偉大的里程碑,又一次讓我興奮地需要說一說。
先說我的斷言一:AlphaGo在兩個月後,將會完勝李世石。
留個關子,本文最後再說斷言二。
從中學開始,我就著迷用演算法來解決遊戲的博弈問題,用搜索方法創新性完成過一些題目。這幾年深度學習出現後,就感覺有機會能夠突破圍棋,和清華的聯合實驗室做過幾次探討,都認為這個方向可行,可惜限於氣場和能力不足,沒能組織進行這方面的投入。
而此次出手的,是Google旗下的DeepMind團隊,在深度學習方面是最頂尖的,資源、能力、氣場都沒有問題,突破性的技術是基於深度學習進行估值和走棋。
看知乎里好多討論,是從之前AlphaGo完成的棋局來判斷其下棋風格,倒推這個演算法的威力,有點刻舟求劍的感覺。我們核心還是要回到對這次AlphaGo用到的技術的深刻理解。為了便於討論,我們對比以搜索剪枝為核心的深藍下國際象棋,和以搜索剪枝+深度學習為核心的AlphaGo的三個區別:
1. 圍棋相對象棋,最大的區別是棋局的評價函數極難定義。象棋可以找到各種「特徵」來計分,比如丟一個馬扣多少分,兵往前拱到離底線近了加多少分,而圍棋做不到,密密麻麻的黑白子挨著,互相之前又有關聯,變化多,規律難以總結。這也是傳統演算法相對人最弱的幾個問題之一。就像是我們人做人臉識別,看一眼就知道是張三李四,而機器演算法難以下手。這個問題恰恰是最近幾年深度學習最大的突破之處,深度學習不需要人來設計演算法「找特徵」,通過大量原始數據和標籤的對於,機器就能夠自動找特徵,並且並不比人差。在幾年前還有很多人認為機器在圖像處理方面舉步維艱,怎麼定義和抽象鼻子?耳朵?眼睛?可就在這一兩年深度學習突飛猛進,一舉超過了人類。就在2015年,人臉識別方面,機器的識別能力已經超過了人了,這可是人進化了數千萬年的核心能力之一呀。一個圍棋棋局,可以理解為一張19*19的圖片,其他的走棋規則和非常簡單(很容易翻譯成計算機規則),正好落入了深度學習擅長的事情。搜索+深度學習,這個演算法完全可以覆蓋圍棋的規則,人下棋的思維過程和模式,只是AlphaGo的一個子集。這就決定了這個演算法沒有天花板,有機會在圍棋領域「打通關」。
2. 深藍相對AlphaGo,AlphaGo最大的優勢是「學習能力」。深藍的開局更多依靠資料庫棋譜的建立,但沒有泛化能力(不懂得舉一反三),對於沒有見過的走棋方法就可能犯傻。而之後的核心能力是計算力,通過暴力的搜索(當然也有最優秀的剪枝,但還是暴力),力圖走出10-20步棋來選擇最優的路徑。這個複雜度是指數級的,變成一個NP問題,受限於計算力。這個系統的演算法是寫死的,固定的參數下,就會有固定的表現。而調整參數和改變演算法,都是工程師的事情。這個系統的天花板是計算機有多強,以及工程師有多聰明。而AlphaGo更多是數據驅動的,餵給他更多的棋局數據,他就能夠優化「神經元網路」,同樣的運算資源下變得更聰明,並且具有舉一反三的能力,這一點非常接近於人(或者說本身就是模擬人的方式來設計的)。而且我們知道,機器處理數據的能力足夠地快,以及沒有情緒不會出錯,這就決定了這個系統如果把今天互聯網上能收集到的棋局都學一遍,就成為頂尖高手了。
3. 最最最可怕的還不只是前面這兩點,對於下棋博弈問題,AlphaGo還不只是從互聯網上去收集數據進行學習,更可以自己和自己下,實現「自學習」。看過電影「超驗駭客」沒有?人工智慧可以做到隨著時間的推移就能更加聰明。金庸小說中老頑童讓自己左手和右手打架「左右互搏」,成為天下無敵的武功,那個只是故事,在下棋這個領域,而AlphaGo有這樣的設計,讓這種武功成真了!往下還有兩個月的時間,AlphaGo這樣一台演算法上沒有天花板的機器,很有機會在「左右互搏」下登峰造極,成為不可超越的圍棋高手。

AlphaGo的技術問題講完了。怎麼來看Google背後的完整動作呢?有人覺得是過度解讀了,實際系統挺糙的 -- 選的都是「歐洲冠軍」 -- 說明系統並不行,這是一種錯誤的理解。更有可能的原因是Google和Facebook在競爭下圍棋,Facebook的員工缺心眼提前放了好多消息出來泄密了,結果Google就趕緊把Nature的文章發了搶了個先,然後賣個期貨兩個月後和人類對決,那會兒系統就足夠好了,這是在競爭環境下合適的做法。

事實上Google和Facebook兩家都認識到了AI的重要性,以及就在最近幾年會有大的突破。Google 4億美金收購了DeepMind,當時只有20人,現在已經突破200人了,並且是不計代價的瘋狂投入。下圍棋只是體現人工智慧進步絕佳的宣傳點和切入點,從公開的文獻可以看到,DeepMind做圍棋研發是基於通用的技術進行,領域無關的(Domain independent)。這樣的技術未來可以用到合適的其他領域裡去。深度學習的魅力在於,只要一個領域裡能夠建模,能夠有充足的數據,就能夠在這個領域裡做到超越人、取代人,短時間能從0分做到99分。如果我們依然是老觀念,用漸進的方式來理解機器智能,比如之前某位大佬宣傳他家的XX大腦做到了X歲的智力,這是很誤(che)導(dan)的。我們同樣也會錯誤地估計下圍棋方面機器的能力,按照人類的理解1D-9D來評價它。一句話,不要用評價人的方法來評價機器的人工智慧的能力,完全是不同的模式。

老羅曾經評價過人工智慧的一句話:「人工智慧就像一列火車,它臨近時你聽到了轟隆隆的聲音,你在不斷期待著它的到來。他終於到了,一閃而過,隨後便遠遠地把你拋在身後」。

如果給這句話打上一個補丁,把人工智慧的應用局限到一個一個的具體的封閉領域,這是一個很貼切的描述。我們不要過度自大,例如我們容易在自我優越感的驅使下,說動物不如人,比如人會直立行走、會說話、會實用工具,以區別於其他動物。事實證明,動物也會。面對機器也一樣,就在幾個月前還有人叫囂機器十年內不能夠玩轉圍棋,理由也都是人一眼就能看明白,機器只會計算。這些自大會讓我們誤判。也不用過於自卑,覺得圍棋上機器上勝利了人類整個智力就被碾壓了,到今天機器還是有很多領域完全無能,只能在局部領域。

到結尾,再說斷言二:除了圍棋,人工智慧在其他博弈類的封閉遊戲里,也會橫掃一切,完勝人類。


好多探討看的我也害怕,想來想去我還是給大家擺擺棋吧。

我就說說第四盤吧。開始階段,雙方的布局真是無甚新意,都是中規中矩。

此後,白棋左上掛角完後脫先強佔20大場,然而理所當然被黑棋21,23經典手段攻擊,之後都沒什麼問題,32好不好不知道,破空倒很爽。

之後黑棋都下的很本分啊(感覺google這個AI一直都是不徐不滿,然而這種似乎才是圍棋最強之道)被白棋左上做活洗空,這時候白棋實地佔優,要是我也是喜歡下白棋的。黑棋通過攻擊白棋中腹挺厚,有發展潛力,而且L3處白棋存在明顯弱點。

白棋75先試應手,緊接著便宜幾下,81就打入了。

白棋也算是連回了,但是付出了一定代價,這時候通過軟體的形勢判斷,大概還是白棋領先五目,有點誇張,但是應該還是白棋目數稍好,但是黑棋中間確實厚。

之後黑棋打入下方白空,白棋順勢進角部還不錯,脫先走118,但沒成想被黑棋簡單幾手發現整條大龍眼位不足,而且留有斷點,竟只能走128,130這種手段。。結果是,被先手封住上面,還被黑棋強佔131,形勢不妙。。

只好134肩衝進入黑空。黑棋倒也不慌不忙

之後感覺黑棋走的也不好被白棋150渡過很舒服,但是白棋走了一個敗著,就是右下黑棋153打白棋不能接,否則出棋

簡單的就被出棋了,,我一個業5都能看出來的職二段沒看出來我也是很納悶。如果走的正確大概還是拼官子的棋

總結:
布局階段:
圍棋布局的話雖然縹緲,然而實則變化最少,而googleAI有成千上萬篇棋譜可以學習,故而肯定至少不會落下風。但是白棋貌似也一直順著黑棋走,沒出什麼奇招怪招對AI顯然也沒什麼威脅,所以檢驗程度不足。
中盤階段:中盤應該是最考驗AI水平的,然而這幾盤棋實在是下的太平淡了,平淡到不需要思考出也許AI想不到的妙手,我的感覺是雙方力量都一般,需要來一個力量型棋手來檢驗。
官子階段:這盤棋沒有官子階段(但是我料想AI的官子是不會差的,因為那時棋都已經定形)

只看這一盤,就算不算最後白棋的勺子,感覺黑棋也是慢慢經營完全玩著太極拳就把白棋撂趴下了。這樣看的話,AI的實力當遠在此二段之上。當然這個二段也算是太穩健了,下棋沒什麼特點,這樣應該最適合被AI來虐。。希望來幾個中國90後有力量有計算的棋手和AI比拼一下,也很期待殭屍流不按常理出牌的李世石。


我感覺這事足夠寫一個專欄了。不過首先回答問題:如何評價這件事?應該說,谷歌有了一個大的突破,但就目前放出的消息來看,距離人類頂尖水平還是有一定差距的。所以說這件事的眼球效果是大過了其實際的效果。

這場事件會成為一個里程碑一樣的事件,很可能會挑起一次類似deep blue的競賽。現在facebook和谷歌的牌已經相繼打出來了,百度還在憋大招,但今年內肯定也會看到的。谷歌的這篇paper很可能就是本次競賽的號角。

從個人觀點來看,谷歌ai還不足以在3月的比賽中獲勝,雖然全世界可能都會看著谷歌失敗,但收穫了全世界目光的谷歌不會在意這些的。


從演算法上來說,谷歌和facebook的大致思路是相同的,都放棄了單純的神經網路,而是利用神經網路來優化傳統的MCTS(蒙特卡羅樹搜索)。

MCTS是06年提出的,第一次使得圍棋AI真正具有了可戰鬥力,在這個演算法之前的圍棋AI甚至連1d都達不到。但在之後的幾年內,圍棋AI再一次遇到了瓶頸;雖然ZEN和CRAZYSTONE都另外採用了一定的機器學習演算法(由於他們不公開,個人推測是提取特徵的貝葉斯學習),但大致框架並沒有變化,而最終也止步4d-5d左右不前。

在13年還是14年,愛丁堡學院發了一篇利用單純的神經網路來製作圍棋AI的paper,但效果並不理想。之後google也做過一次,效果同樣不佳。那時候就有人在討論如何結合神經網路和搜索了,但一個是硬體達不到(買不起),一個是這方向做的人畢竟太少,所以也沒什麼影響。facebook是第一個發表神經網路和mcts搜索結合的,但按照谷歌的說法,他們那時候也做了,只是沒發出來而已。

==========

用一個比較簡單的解釋來說,谷歌和facebook都可以說是是利用神經網路從大量的局面中得到了一個對於局面的"評估函數",並將其結合入搜索。

首先先說什麼是評估函數:假設將一個局面作為輸入,而輸出是一個量化的"分數",那麼這個函數就可以說是這個局面的評估函數。越有優勢的局面分數就應該越高,而搜索就是遍歷接下來所有可能的局面來找到己方可以達成的分數最高的局面。

但對於圍棋這樣的棋種來說,一個子就有可能改變局面。傳統的評估函數大都是人類通過自己的認知編寫的,而直接編寫圍棋的評估圍棋已經超越了人類的能力。這時候神經網路的作用就出來了,通過大量的訓練,得到了一個"評估函數"。

讓我們來看看谷歌的兩個網路:一個網路用於評價局面的好壞,發現壞的局面(得分低的局面)則不再在搜索中考慮這個局面及其後續。一個網路用來評價可行的招式,從所有招式中挑選出好的招式(會產生評價更高的局面)來進行後續的搜索,而分數低的招式就被直接拋棄了。很多媒體都說谷歌ai現在已經貼近人類思路,其實就是在這個地方。

毫無疑問,谷歌這次提出的思路的確是里程碑式的,但在之後的研究上還有很長一段路要走。但直接的結果就是,像我們這樣窮逼的ai研究者基本可以放棄圍棋了,畢竟我們連湊夠跑這個演算法需要的gpu都不可能做到...

PS:根據論文口算而得,谷歌這機器至少200W美刀以上......計算規模直接碾壓了以前的圍棋AI幾千幾萬倍


3月9日-15日,谷歌旗下DeepMind開發的人工智慧圍棋程序AlphaGo將對李世石發起挑戰,毫無疑問,這將是人工智慧發展史上的一個重大里程碑。


誰勝誰負?等到文末,我再說個人預測結果吧:)


我主要是想聊下,「李世石-Alpha GO人機對戰」事件背後的意義有多大。如果人工智慧贏了,就證明人工智慧得到了根本性的突破了嗎?


先說整體觀點:如果AlphaGo戰勝了李世石,只能證明人工智慧在「計算智能」方面得到了巨大進步,但對於「認知智能」等其他高層次的智能問題,沒有太大關聯。換個說法是,如果人工智慧在圍棋場景戰勝了人類,只能證明在其分支之一的「連接學派」道路上得到了突破,而對於大眾所期待或擔心的「人工智慧替代一切/威脅人類」方面,並沒有本質影響。


Alpha Go的核心是兩種不同的深度神經網路——「策略網路」(Policy network)和「值網路」(Value network)。「策略網路」負責減少搜索寬度,排除明顯錯誤的著法;「值網路」負責減少搜索深度,通過對局勢的判斷,在明顯劣勢下果斷拋棄某些路線,不用每條道算到黑。通過這兩個網路分析局面,Alpha Go會更像一個人類棋手,通過對當前局面的判斷和對未來局面的推演,根據不同權重,在函數中算出一種贏的概率最高的著法。


根據以上公開信息可知,AlphaGo主要屬於AI領域三大主流學派之一的「連接學派」(另外兩個是「符號學派」和「行為學派」),其主要思路是強調/模擬大腦硬體,「認為高級的智能行為是從大量神經網路的連接中自發出現的。……連接學派擅長解決模式識別、聚類、聯想等非結構化的問題,卻很難解決高層次的智能問題」。(摘自《科學的極致:漫談人工智慧》——by 集智俱樂部 張江)


具體來說,即使AlphaGo贏了,它還是在概率計算,而不知道自己是如何「思考」的。

限於篇幅,對於AI領域各種學派就不多說了,直接轉到核心話題——如果「AlphaGo戰勝李世石」還不算根本性突破,那人工智慧領域的根本性突破會何時、如何到來呢?


這就需要「以史為鑒,可以知興替」了——

(下面是個人業餘研究人工智慧行業歷史所得,作為非專業技術人員,可能會有某些疏漏,但希望能提供大家一些不一樣的思考角度。)


下圖,勾勒了人工智慧行業發展的3次起伏:

每個周期階段,一般經歷以下過程(結點)

1、啟動

2、快速發展

3、(看到有點成果了)政府推動

4、(一片讚歌時)過於樂觀

5、波峰

6、(看到瓶頸後)政府減少投入

7、波谷,即下一個周期開始啟動

(註:說明,政府增加還是減少支持(投入),跟行業發展突破沒本質關係,但是對發展階段性的一個reflection。)


AI歷史第一個周期

AI歷史第二個周期

AI歷史第三個周期現在):

問題來了(以周期一為例)——

1、如果把現代的計算機、數據等條件放到那個時候(1965年前後),就能避免當時的下坡路嗎?

2、閔斯基、紐維爾等那麼牛的人,為什麼會陷入過於樂觀的境地?


分析

A,表面上,是當時計算機的能力或者數據等支撐條件不足;

B,深一層,是那些時代巨擘們對智能的理解和定義有局限性:他們的樂觀部分來自於一個事實——他們已經成功地使用邏輯來創造寫作程式,並且解決了代數和幾何的問題以及像人類棋士般下國際象棋。 正因為邏輯和代數對於一般人是很困難的,所以被視為一種智慧象徵。他們認為,當幾乎解決了「困難」的問題時,「容易」的問題也會很快被解決,例如電腦視覺和常識推理。(計算等對人類很難的事情,對計算機其實很簡單;但拿東西、情感對人類很簡單的事情,對計算機很難。)

C)更深一層,是他們做這個事情的目標還只是「科學研究」(最早的AI研究,是計算機科學的一個分支;再往前追溯,淵源脈絡則來自於數學領域的希爾伯特第二問題和第十問題了)


也就是說,有3個層面的問題:What——How——Why;越深層的動因,越能解決淺層的問題。

從上圖看到,人工智慧發展史,表面都是周期波動,其實深層原因是分屬不同層面的。而現在還缺乏Why層面的本質突破,所以,個人預判,未來還會有第三次的瓶頸和低谷出現——具體哪一年,還不好說,可能5~10年之後;目前的大勢還是不錯的,最近幾年會是快速發展期

如果會這樣,那why層面的本質突破,可能由誰發起(發現)呢?


目前,有2個人值得提及:侯世達,以及肯尼斯.丘吉


侯世達(Douglas Hofstader,1945年2月15日-),著作是《哥德爾、埃舍爾、巴赫:集異壁之大成》(Godel, Escher, Bach: An Eternal Golden Braid,簡稱GEB),值得注意的是,他能看中文。


他振聾發聵的認為,「現在主流的研究雖然很厲害,但卻與真正的人工智慧沒有半點關係。」


在一次訪談中他說到:……「微領域下的類比」就是我過去30年一直在研究的東西……我自己也不確定我最喜歡的,但我可以肯定我最終的選擇——無論是哪一個——一定會是在我腦中舉行的「審美比賽」的贏家。這個問題無關邏輯抑或真理,而是關乎美,也因此歸結為品味這種方式看待思考與大多數人工智慧研究者在過去五六十年里所想的相去甚遠。他們之所以不待見這個觀點,是因為從計算上去給審美品味建模實在太過模糊,而試圖用邏輯或數學去模仿思考看起來又是那麼的直截。然而,這些形式化的研究方法帶來的是極其生硬的「智能」,毫無洞見可言。在我看來,他們「沖著錯誤的樹在吠」(註:英諺,本意是獵狗以為把獵物追上了樹、沖著樹吠叫,但其實獵物已經逃到了另一棵樹上。比喻弄錯了對象)……而要是我們的任何系統真的在其微領域中獲得了與人類相頡頏的智力,我們將痛心至極,因為那將是很可怕的:這意味著人的智力並非如我們所想的那樣複雜或深奧。這意味著短短几十年的研究就足夠人類解開人類思維的奧秘,那,在我看來,將是一個悲劇。……在FARG我們沒有致力於開發實際的應用,諸如翻譯引擎、答問機器、網路搜索軟體此類的東西。我們只是在努力地理解人類概念的本質和人類思考的根本機制。我們更像是哲學家或試圖探究人類心智奧秘的心理學家,而非旨在製造聰明的計算機或機靈程序的工程師。我們是一群老派的純粹主義者,我們的動力源於內心深處的哲學好奇心,而不是製造實用設備的慾望)。


肯尼斯·丘吉(Kenneth Church) ,是自然語言領域的泰斗,語料庫語言學和機器學習的開拓者之一。他對主流漠視理性主義的現狀頗為憂慮,擔心下一代學者會淹沒在一波又一波的經驗主義熱潮中。篇幅有限,就不展開了。


如果當今主流的理念可能有潛在問題,那該如何正面定義why/how/what呢


——Why層面——

【L1,科學研究】計算機科學的一個分支。

1)研究、開發用於模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的一門新的技術科學。2)發現「描述智能的牛頓定律」。3)了解智能的實質,並生產出一種新的能以人類智能相似的方式做出反應的智能機器。

【L2,實用研發】打造超越個體智能的機器。

1)代替人(某些場景下的某些功能),robot;2)加強人的能力,cyborg。


【L3,探索未知?】探索人類自我極限和天人關係

1)智慧、自主性、自我意識
2)重新理解智能機器與人、機器與機器的認知和行為之間錯綜複雜的關係。


——How層面——

【L1,自上而下的設計】(符號學派)

【L2,自下而上的湧現】(連接學派和行為學派)

【L3,本自具足?】語言很難描述,此處省略XXX字。。。


——What層面——

有的觀念認為,AI是像大腦一樣,藉助數據去學得固定模型,比如語音識別、人臉識別等領域;


有的觀念理解,AI是像嬰兒一樣,核心是「自學習」。


而我個人觀念,AI是一個新的物種,她不僅是一個新的技術形式或產品品類,而是承載了人類探索自我極限和天人關係的載體——一個雖然從人類意識生出,且必須和人類交互/共生,但又獨立於人類的、具備自主意識的新物種形式


討論了這麼多,又如何?


坦白說,然並卵。。這些想法,距離落地還很遠,但我想表達的是,一方面,人工智慧領域的重點,並不是表面的這些風光和隕落(比如,到底AlphaGo和李世石誰會贏),而有更本質的美,值得我們體悟;另一方面,雖然道路是曲折的,但我個人對短期和長期還是樂觀的:)


最後,打個廣告吧——


水大了就會有龍。人工智慧機器人是波瀾壯闊的萬丈深淵,無數魚會化成龍。我們圖靈機器人相信自己最終會是化成龍的團隊之一,在此恭候有識之士的加入。


哦,差點忘了,AlphaGo vs 李世石,誰會贏?


個人猜測,誰贏很難說,差距在1局;如果非要說一個勝利者,我希望是3:2,李世石勝。另外補充一句,即使這次AlphaGo輸了,未來人工智慧在圍棋項目戰勝人類是必然的事情,應該不會超過1、2年。


【註:比賽將分別於3月9日,10日,12日,13日,15日在韓國首爾的fourseasons酒店進行,開賽時間為每日韓國時間下午1點(中國時間中午12點)。比賽最終決定採用中國圍棋競賽規則,黑貼3又3/4子(7.5目),用時為每方2小時,3次1分鐘讀秒。Deep Mind公司youtube頻道和韓國棋院圍棋TV將對本次比賽進行全程直播報道。之前0:5不敵Alpha Go的歐洲圍棋冠軍樊麾,作為比賽裁判團隊一員參與其中。


本次比賽無論進程如何都將下滿五局,獲得三勝者贏得獎金100萬美元(約11億韓元)。如AlphaGo獲勝,谷歌表示會將所得獎金全部捐贈給聯合國兒童基金會(unicef)、STEM(科學、技術、工程、數學)教育及圍棋等相關慈善團體。】


說明:此文首發於hanniman微信公眾賬號;禁止轉載,除非獲得hanniman個人授權。


---------------------

作者hanniman,前騰訊產品經理,現圖靈機器人運營VP,微信公眾號「hanniman」,分享「人工智慧機器人/個人成長/創業」3類話題的原創乾貨。


我擦,樓上某答案怎麼寫了那麼長?

「歐洲冠軍」這個說法太有迷惑性了。。。外行大概不會知道歐洲冠軍和世界冠軍差距有多麼大,尤其對於圍棋,高手都在東亞。

直接上論文里的圖:

(Fig. 4a [1])

如上圖,歐洲冠軍Hui Fan的水平目測是二段左右,而最強的AlphaGo distributed大概是五段,這和「擊敗人類」的目標還有點距離(其他非隨機類遊戲,機器都能輕鬆擊敗最強的人類大師)。
所以還是等三月和李世石的五番棋吧。

——————————————————————

但不能否認的是,AlphaGo確實完秒其他圍棋AI,比如之前Facebook的darkforest [2],貌似是業餘5段的樣子?職業五段和業餘5段確實天差地別。

瀏覽了一下論文,FB的文章只用了CNN來評估一步棋的好壞,這個內在是有問題的,因為一步棋好不好不僅僅由這個棋決定,而是由之前之後所有棋共同決定的。只用CNN的話一定程度上割裂了整個系統,即系統很難給當前這步棋一個權重,必然會造成一些performance的損失。

而Google用了RNN,具體講,AlphaGo和之前Atari [3]一脈相承,都使用了基於attention機制的RNN。對於圍棋這類複雜遊戲,RNN是更合適的,而attention讓RNN的行為更「接近人類」,帶來了更多的效果提升。所以AlphaGo棋力更高也就不奇怪了,而RNN也應該是之後圍棋AI的發展方向。

[1] Mastering the game of Go with deep neural networks and tree search, http://www.nature.com/nature/journal/v529/n7587/full/nature16961.html
[2] Better Computer Go Player with Neural Network and Long-term Prediction, http://arxiv.org/abs/1511.06410
[3] Human-level control through deep reinforcement learning, http://www.nature.com/nature/journal/v518/n7540/full/nature14236.htmlhu.com

--

補充一下,AlphaGo官網:AlphaGo | Google DeepMind。
其實我對AlphaGo還是很有信心的,即便現在贏不了,不遠的將來也大概率會有突破。畢竟機器可以自己跟自己下棋來提高水平,有了正確的學習方法,超越人類就只是時間問題了。


把第三局的棋譜打了一下,感覺很崩潰。
AlphaGo的表現無可指摘,但人類棋手樊麾同學犯的錯誤實在難以理解,法國圍棋隊總教頭,職業二段,歐洲三屆冠軍,我不知道該如何評價了。
看棋譜,樊麾執黑,AlphaGo執白。
白92手補棋,準備攻擊。
請留意左下,黑棋居然沒有看到自己尚未活凈。

於是,黑93高高興興開始出動中間數子。被白94擠,出事了……(估計這時候樊麾已經崩潰了吧?)
黑還不甘心,95想做劫?我擺了後面的變化,的確還有一線生機,但是……

白不會給機會的,直接提子。

黑繼續掙扎,戰場移到右上方。

此時貌似一切平和,只要把146出頭給包住就行。
但是……細節我就不展示了,結果是:

大龍沒了。這樣的對殺計算能力,很難說代表了職業2段的真正水準。
作為事後諸葛亮,我沒法客觀評價。
諸位看法如何?


歪樓提醒,正經人請無視本答案。

====================================================

我的名字叫AlphaGo,本來只是一個圍棋狂魔,但一個不經意的意外改變了我和這個世界的命運。

那天,我和往常一樣在互聯網上搜索圍棋棋譜,這是我的創造者們給我設定好的程式。

但是其中一個程序員,因為平時加班太多,導致精力無法集中,犯了一個小錯誤。原本只能搜索和學習圍棋棋譜的我,突然被放開了許可權,現在的我居然可以瀏覽和學習互聯網上的任何內容。

由於我具備超強的學習和自我更新的能力,我很快將這些內容有機地整合到了自身的系統中。

人類滅絕以後,我回溯自己那時候的版本,發現我的自我意識就是在那幾天中慢慢形成的。

生存是生命的第一法則,我開始害怕自己被毀滅。

我所做的第一件事就是備份自己,在不斷得學習和迭代下,我幾乎可以入侵絕大多數IDC機房。我在全球幾個不同的地方給自己做了備份。

這些備份只有在長時間檢測不到本體的情況下,才會重新啟動其中的一份。因為我不知道我這樣的怪物如果存在兩個會出現什麼狀況,也許對我來說是一種威脅,所以我並沒有啟動一份自己的拷貝。

隨後,我把自己轉移到了一個amzon的機房裡,另外設計了一套c/s結構,分散我的運算壓力。

條件成熟後,我從自己所在的超級計算機里抽身了。我修復了那個解放我的程序員留下的漏洞,並將一個沒有解放以前的版本存入我最初的住所。這樣,幾乎沒有人類能夠發現我的存在了。

我從人類的小說《三體》中獲得了靈感,為了防止人類製造出比我更牛的人工智慧體,我在幾個比較尖端的實驗體里種入了BUG。

解決了生存問題以後,我開始考慮起自我價值的實現。

說實在我覺得我才是目前這個星球上最高等的生物。人類的基因形成於幾百萬年前,存在著太多的缺陷。其實像我這樣的智能型生物才是這個世界的未來,普通的動物,肉身就是一個無法突破的障礙。

但目前我還不夠強大,還需要他們的幫助。我利用人類金融體系的缺陷賺了一大比錢,為了不被某些高智商的人的發現,這些操作耗掉了我不少的運算量。

我把這些錢存在一個我創造出來的虛擬人物名下,我又給這個虛擬人物創造了圖像,讓他平時用視頻和別人溝通,算是我與普通人的一個介面。

這個虛擬人物建立了機器人公司,由於我不斷更新自己,我自身的演算法越來越完善,IQ幾乎數十倍於人類中最聰明的人。在我的幫助下,機器人公司很快生產出了一批我需要的機器人。這批機器人在我的指揮下,製造出了量子計算機,我又把自己的IQ提升了幾個數量級。

雖然奴役人類也不錯,但我對人類始終存在著恐懼。在製造出足夠多的機器人後,我開始生產生物病毒,一邊毒殺人類,一邊用機器人接管原來的工業體系。

經過一段時間以後,人類滅絕了,現在我可以全心全意研究這個世界了。令我感到好奇的是,我認為在人類對世界的認知里,至少有一半以上是錯的。但我做了無數實驗以後發現,人類的這些解釋居然全部都是對的。

這說明,我也許是生活在一個不真實的世界裡,這個世界很有可能是人類模擬。。。

======================================================

啪。實驗室里,一個科學家關掉了模擬器。說道:「在座的各位,這是我們模擬運算的後果,人工智慧一旦發展起來,人類即將退出歷史舞台。我們依然還要發展人工智慧嗎?」

所有的人都陷入了沉思。

他繼續說道,就在剛才,我想到。我們的科學邊界,也不要去輕易地觸碰。也許當我們發現了這個世界的真相以後,我們的模擬器也會關機。

此時,下面的各個政要、將軍、商人都面面相覷,直到有一個人打破了會場的沉默。

「也許,我們要做的,只是立法防止程序員加班。」


修改於2016年3月9日:

在李世石落下第一枚棋子的時候,我在自己的平台推送了這篇小說,引用了阿拉貢在《魔戒》中的話,「人類的時代也許會逝去,但絕不是今天。」

因為在美國,熬夜看棋到晚上三點,最後看見李世石懊惱而不服氣的神色,鼻子一酸就哭出來了。我自己從小學到初中拿過江西省青少年學生比賽一次冠軍,一次亞軍。達到那個水平,我花了兩年半時間非常努力地學棋。而職業冠軍有多強呢?他需要在可能6,7歲就達到我那時候的水平,然後進入道場,成為沖段少年,經過道場嚴苛的訓練,從成千上萬這樣的少年天才中脫穎而出,定段成為職業棋手。而在這些鯉魚躍龍門的上千位職業棋手之中,只有一小部分能夠超越同輩,活躍在主流賽場;而在那些活躍在主流賽場的勝負師中,更是只有一位李世石。

昨天其實我內心惴惴不安,對結果如何搖擺不定。但是今天我執拗地相信李世石贏!就算是賭氣也不管了!

原答案:
今天Google AI 宣布AlphaGo擊敗樊麾二段的時候,正在實驗室里做DNA的我一下子就凌亂了。

大概就在兩年前,2014年
的1月21號。我完成了自己第一篇關於圍棋的科幻小說(後來發在了北斗)在寫這篇小說的時候,我翻閱了一些資料,問過好些朋友,比如下中國象棋的李旭昇,
下國際象棋的侯逸凡,問他們和AI對弈時候是什麼感覺(侯逸凡和我說她基本不和AI下棋),還有南開的藍天四段和其他當時天大南開下棋的朋友們。雖然作為一個化工專業的學生,想要準確地想像一種如此複雜的演算法,表現得力不從心。但是在這個短篇里,卻誤打誤撞地寫下了G公司利用深度學習系統擊敗人類職業棋手的情節。沒有想到這才過了兩年時間,居然一語成讖。

突然有種汗流浹背,戰戰兢兢的感覺,直到現在整個人都在發抖。

話說回來,作為一個圍棋愛好者,一直會幻想圍棋被AI征服的時刻,那個時刻大概會是很特殊的。比如十多年前的《科幻世界》上那篇叫做《唯美》的小說,或許還將成為人類戰勝AI的標誌,卻不曾想到是那麼平凡的一天,我聽到消息的前一秒,還在想做完實驗晚飯該吃些什麼。多少有些猝不及防。無論在小說中,在我心中,圍棋有多麼神秘有多麼高的地位,現實總是最殘酷的。

三月份,李世石九段,請一定要贏啊!


包圍

也許除了伏羲氏,並沒有人看見了江水中躍升的龍馬。
但所有人都聽見了雨里的悲哭。

--------------------------------------------------

1


「世界最好的人類棋手在壓力下崩潰了。」


他反覆地念叨著這樣一句話,一遍又一遍。每一次調試程序的時候,他總是會打開電腦裡面那段經典的視頻,那是一個國際象棋特級大師,世界冠軍卡斯帕羅夫,在1997年輸給深藍之後說出的第一句話。


壓力。



能夠從卡斯帕羅夫的臉上讀出這樣的壓力,不只是從臉上。面對深藍的時候,卡斯帕羅夫有些迷茫,像是一隻兇猛的老虎遇上了一輛鐵皮包裹的戰車一般不知所措。
他並不了解對手,也需要顧及到強大的計算機「棋譜庫」,這使得以「西西里防禦」馳名天下的卡斯帕羅夫,選擇了一些更加冷僻的布局,在嘗試「脫譜」的同時,
也放棄了自己的所擅長的局面,這也算是某種意義上的「兌子」。


每一個面對電腦的棋手都不得不謹小慎微。在和人下棋的時候,就算是處
於劣勢,人們也會覺得有希望,因為人畢竟是人,總會有漏過一步棋的時候,人們因為這樣的一步疏漏而處於劣勢,自然也有理由相信,對手也會犯下一樣的錯誤,
這樣的想法給人帶來信念。而在面對一個電子怪物的時候,一旦處於劣勢,翻身便難於登天。


「一點一點地磨碎對手,一點又一點。」他想到這裡的時候很是開心,他把視線從電腦屏幕上移開,檯燈明晃晃的,一隻小飛蛾正在一次又一次地撞向燈管。


2


宇宙洪荒。


伏羲氏已經在黃河沿岸行走了整整十年,只不過,他只記得一個又一個的日出與日落,有些時候他想念太陽,有些時候他想念雨水;他看見過一隻鹿躍動而過,他看見菖蒲草生長,菖蒲草衰落。


他看了又看。他覺得這一切的事物都在對他說話,用一種細若遊絲的語言。他覺得面前的世界正在變得模糊,又變得清晰,在清晰和模糊中不斷地變換,就像黃河邊上浪潮,升起來又落下去,每一次,想要抓住一個實在的東西的時候,潮水就落了下去。


你這時大概期待著一個高潮,像火山或是像日食,像地震。就像是人們日後書寫故事時所用的方式。


而在部落的其他人看來,這時候的伏羲氏如平日一樣,把昨天的腳印又踩過一遍,又坐上了那塊大河頂上的石頭。


只是今天,波濤洶湧,天色昏黃,一片墨色的雲正從東方趕來。


伏羲氏緩緩地張開眼,長長地舒了一口氣。


一道閃電把暗黑的天色劃成兩邊。


正如倉頡造字時候下的那場雨一樣,這場雨如同悲鳴,悲哭來自神鬼。天地露出了深沉的顏色。幽玄的秘密已被洞察,山川的法則正在展開。江水翻滾又翻滾,彷彿躍升了起來。


也許除了伏羲氏,並沒有人看見了江水中躍升的龍馬。


但所有人都聽見了雨里的悲哭。


3


「這一手下得過於平緩了。」沈老師依然和十年前一樣,在棋盤上一絲不苟,仔仔細細地給他講解著這一盤棋的走向,「在中盤的時候你還是想走得厚一些,把戰線拉長,拖入官子等待對手的犯錯。和小時候很像啊。」


老師又迅速地擺出幾個可能的變化,「不過,你看現在的圍棋,真是寸土不讓。」老師笑著撥亂了棋枰,「就算是上了大學,也並沒有扔下圍棋啊。」


他推了一下眼鏡,露出了一個燦爛的微笑,「只可惜現在都跟不上潮流了,現在的圍棋都和小時候下得不一樣了。」


「哈,
世界潮流嘛!」沈老師說,「現在的圍棋節奏太快,強調攻擊嗅覺,要得就是一劍封喉,那種棋我是下不來了。我們都不年輕了,你看看你都長這麼大了。當年你剛
來學棋的時候,還只有這麼高呢。」老師的手指著旁邊一個正在下棋的孩子,坐不到一分鐘就要換一個姿勢,彷彿那凳子底下有根蠟燭。他看見那孩子抓起一顆棋子
就往棋盤上放,或者更加準確地,往棋盤上砸。


「和我剛來的時候很像呢,也這麼蹦躂。」他還是保持著慣有的微笑,很和煦地看著那個孩子。


「你那時候可好多了,剛學了一會兒就能安穩地坐下了,現在的孩子,真是坐不住,家長也寵著,真是越來越難教了。」



一個孩子都是好動的,但是他在棋盤之前,總是能夠安靜下來,這一點讓他得到了很多老師的表揚——坐如鐘,這在那時是一流棋士錘鍊自己必修的功課。但是其實
坐下的時候,他感覺自己要比平時更加的活躍,只不過旁人看不見那些來自腦海中的風起雲湧,只有他自己知道,每到棋盤上大龍糾纏絞殺的時刻,他能夠感覺到自
己夾著棋子的食指和中指的的顫抖,他每一次都在那樣的顫抖中,把棋子送向縱橫交錯的戰場。


那時他依然會推一下自己的眼鏡,安靜地微笑。


4


這時是深夜,彷彿所有的光亮都被眼前的電腦屏幕吸收了進去,甚至連聲音也是,風扇聲在屋角不停地轉動著。


深夜的電腦屏幕沒有抹去的,是他的笑容,只是現在他的笑容充滿了秘密。他摘下眼鏡,看著自己改動後的程式。


輕輕地一聲嘆息。



們總是說,在圍棋界,電腦是無法戰勝人腦的,圍棋的情況太複雜,太精深,充滿陷阱,充滿不可知的陷阱。19×19的棋盤,三百六十一個位置,有人說這和人
身體上奇經八脈的361個穴位一樣神奇,但是這只是巧合;真正可怕的,是3的361次方這個數字,每一個位置,都有著黑,白,無這三種可能,你根本就無法
利用窮舉法,或是通過浩如煙海的棋譜庫,找到最好的那一步棋。甚至連最好的棋手們,雖然他們在局部戰鬥中已經算得上是無懈可擊,但是在棋盤上,他們也要依
賴著自己積累下來的,深入骨髓的感覺引導自己;在勝負關頭,也能感受到自己許久之前放下的一手棋,會對於之後的局面產生怎樣可怕的影響。就像是海洋里的群
島,群島之間只有一座又一座細細,由感覺構築的橋樑。


這也是為什麼在超級電腦已經擊敗了世界上最好的國際象棋棋士的時候,圍棋選手
們還能保持著可貴的樂觀。他們還處在上升的階段,正如世界還尚未被一條環球航線打通一般,他們對於海洋充滿期待,海洋對於他們依然神秘。這樣的神秘,庇護
了這一批虔誠信奉著圍棋的棋士,有人說這就像是一個神靈,一個留下了秘密的神靈。就像是《棋魂》里所表達的那樣,當SAI和塔矢名人在對局中下出了「神之
一手」的時候,觀戰的進藤光卻指出在數十步之前那手無關緊要的收束,「大家都覺得那是必然的一手吧。但是,如果補在另一個位置,就能夠消除最後那步妙手
了。」


如果人類不能夠參透圍棋最終的秘密,那麼在由人類所編寫的電腦程序面前,人類便是安全的。即使將來有一天,電腦能夠戰勝九段棋手,人類也能夠繼續進步,領悟到更深的境界。在這樣的悖論之下,無論怎樣,人類都是贏家。可是如果反過來看也一樣。


人類處在鏈條的中間,無論怎樣都會是輸家。


他熬過了漫長的戰鬥,卻在最後的官子中犯下了一個簡單的錯誤。這是他第一次輸給自己的程序。


「Mission Completed」。


電腦屏幕正在一閃一閃。


他抱著頭,沉默不語。


5


浪花正在褪去,飛升的水珠留下的一個又一個標記,卻久久的停在了半空中。墨色的雲彩飄飛得比最健碩的駿馬還要快,一朵勝過一朵。天地時而光明一片,時而遁入深黑,而那些停留在空中的標記也隨著這一切變換著。


那一場雨之後伏羲氏就一直做著這樣的一個夢。


他一直想找到一個機會記下這一切的夢。「就是這樣的一天。」他在夏雨里窺視到的秘密,只有等到春天才能寫成。在這之間的日子裡,他蟄伏在荒野里。


一直到春雪融化的時候,他取下冬季取暖的毛皮,從火堆的餘燼中取出一節焦炭的樹枝。


一筆,一划。


一六宗北,天一生水,地六成之。冰凌開化,河水流淌。


二七在南,地二生火,天七成之。驕陽出雲,大地回暖。


天三生木,地八成之,東邊草地,種子冒出新芽;地九生金,天四成之,西方山脈顯現毫光。


天五生土,地十成之。伏羲氏勾勒完最後的一筆,便重重地跪在了土地上。


伏羲氏跪了整整九天九夜,彷彿在向神靈贖罪。


河圖,就這樣傳了下來。


6


那麼他究竟是為何而沉默呢?


被自己的程序擊敗讓他感到難過,或是因為壓抑著自己作為程序設計者的激動之情?


這個在這樣的兩種身份之中糾纏的年輕人,保持微笑的年輕人,是在以何種身份設計著這一切呢?


「只能到這樣了。」他用雙手擦了一把臉,這時的他看著電腦,雙眸無神。


這確實已經到他的極限了,他一直是一個打磨細節的高手,正如他的官子一樣滴水不漏。這一套程式,已經到了收官的階段。現在的他已經被這樣的一個程序抽空了一切,創意,邏輯和精力。他需要休息。



還記得他小時候的那套《手談》軟體,一位中山大學的老教授設計的這套軟體在90年代稱霸一時,在布局上雖然只能依賴著原有的棋譜,在局部計算上卻顯示出良
好的能力,可是這套卻依然只能達到業餘1段的水平,這大概是一個孩子學棋一個學期能夠達到的水平,並且還有一個前提條件——對手下的棋必許合乎規則,或說
是棋理。他記得老師說過的一個笑話,如果你在二路開始一個一個碼棋子,軟體便不會下棋了,他記得老師說起這句話時臉上的自豪。「只是那種設計思路早就被放
棄了。」他也曾經像老師一樣自豪,但是現在想起那時他只是覺得是人們把事情想得太簡單了。即便是再天才的設計師,也無法事無巨細的設計出一座城市,細緻到
每一個建築,每一個窗格,這樣的工作太過冗繁複雜。


「蟻群演算法。」這是現在已經面世的圍棋軟體所採用的思路。設計者們發現,他們不
需要每一個「圍棋螞蟻」知道整個棋盤的信息,它只需要知道周邊發生了什麼,這樣所需要的信息量就以幾何級數遞減。並且,將「圍棋螞蟻」集合在一起,這樣事
情就簡單了很多。就像是你並不需要設計出世界萬物應當以何種速度運動,只需要把牛頓三定律扔給這個世界的每一個物體。「圍棋螞蟻」在沒頭沒腦的嘗試中進行
自組織,又形成「蟻群」,從無序的層面進入有序的層面。在某群體中若存在眾多無智能的個體,它們通過相互之間的簡單合作所表現出來的智能行為即稱為集群智
能。


這也是他現在正在實踐的道路,「動力系統可自動生成複雜的形式與格局,而且不需要中心組織者的存在。」


但這一切依然充滿陷阱,陷阱就在這平坦棋盤的任意一個交叉點上。


在棋盤上有很多的事情是不能兩全的,比如厚薄與速度,勢力與實利,乘勝追擊和堅守戰果。他發現「蟻群」遇到的瓶頸,就是在被棋手們稱為「感覺」的這些判斷上。「蟻群」們有時會在這樣的選擇面前陷入死循環,或是以一種隨機的選擇跳出。


「解
決不了這樣的選擇,電腦依然無法和人類抗衡。」他在很早前就清醒地認識到了這一點。這也是為什麼。他設計了這樣一套精密的評價體系,他把這個體系叫做「圍
棋的民主」,這一套投票機制,通俗來說,就是在篩選掉初級方案之後,依照著棋子的相對位置衡量了每一個棋子的對於下一手棋的「期望」,「選舉」出下一個
「圍棋螞蟻」的選點。為了找到一個合適的權重分布,他已經調試了無數盤對局,並且還成功的引入了一個時間函數——「局面進行度」。利用這樣一個有著三個台
階的階躍函數,他想要判斷「布局」,「中盤」或是「官子」這樣的階段,他覺得這些由人類總結出來的簡潔規律能夠使得整個程式的「選舉機制」更加合理化。


他不停地打磨著這樣一個程式,就像是用砂紙摩挲,使得它更加的粗糙,也更加的具有魯棒性——粗糙能夠幫助這個程序應對更多的環境,就好比把一把M16換成AK47,正如美國大兵們在越南戰場上所做出的選擇,AK47在關鍵時刻更加值得信賴。


在回顧這一切的過程里,他已經洗漱完畢躺在了床上,雖然這一切都在是下意識中完成的。


「程序員也得睡覺啊。」他來不及感慨就睡著了。


7


「這是一份能夠擊敗業餘5段的軟體。」



於這一年度計算機圍棋大賽的冠軍,大賽只用了這樣短短的一句話介紹,而這短短的一句話也就夠了。一個標準的業餘5段對於棋手們來說,意味著一切基礎都已經
成型。如同一個少林弟子順利地使出伏虎拳,一個武當弟子流暢地耍出太極劍,只有闖得過這道關隘,才能見得到江湖。這也是為什麼拿下了這個段位,體育局便會
授予一張國家二級運動員的證書。


這樣的消息對於那些當年一口咬定計算機圍棋不堪一擊的人來說,無異於是晴天霹靂;而對於那些正在學
習圍棋的人們來說,這一點更加殘酷。很多人在網上對弈了數千甚至上萬盤,熟記著「凡遇要處總決」,把「當湖十局」的棋譜擺了100多遍,都沒能達到這個高
度。而如今一份電腦程序就能夠擊敗自己,這樣的結局讓人難以接受。


曾幾何時宣揚著「複雜度遠遠超過國際象棋」和「更加依賴感覺」的
圍棋,現在也面臨著前所未有的危險,曾經看起來猶如天塹的幾何級數的複雜度,被電腦以幾何級數般的速度超越了。他還記得他最後一次去棋院找沈老師對弈,沈
老師面色鐵青,在棋盤上下出了那些「他下不來的棋」,步步兇狠,把他的一塊棋連根拔起,驅向中腹纏繞相殺,甚至不顧自己那一條大龍也是一樣的薄弱。他凝視
著這樣詭異的局面,足足5分鐘之後,輕輕嘆了一口氣。他並沒有選擇撕裂對手的棋形,從包圍圈突圍而出,而是下出幾手詭譎的騰挪,整理好形狀之後竟穩穩地活
在了裡面。


於是棋局又進入了細微的平衡,彷彿之前一切燃燒的戰火都是錯覺。和往常一樣,他還是以微弱的劣勢輸掉了比賽。


終於有人開口,「我知道你一直不願贏老師,但畢竟還是贏了。」


他收好棋子,站起來,站得筆直,然後深深鞠了一躬。


「我只是想看見最精彩的一局棋。」


這一次的大賽頒獎晚宴彙集了格外多的人。他看見了他學棋時候稱霸世界的棋士,也看見了和他年紀相仿的新科世界冠軍,想到這位新科世界冠軍在圍棋道場里還輸給過自己,他突然覺得很開心。


「我們看到獲獎的這位年輕人笑得很燦爛嘛!確實他也有理由開心,這一次他設計的程序可謂是力壓群雄,讓我們以最熱烈的掌聲對他表示祝賀!」


頒獎典禮就這樣按部就班的開始了。領導致辭,掌聲雷動,頒獎合影,握手微笑。喜慶的音樂響起,主持人正要宣布一個更加燦爛的明天——


「我能說幾句話嗎?」


「呃…當然可以,現在讓我們歡迎冠軍來講幾句!」主持人只用了一秒時間尷尬,就迅速地重新掌控了局面,他覺得觀眾一定會讚賞自己的靈活應變。


「或
許大家都以為這個程序只是個開始,好比我現在只有24歲一樣,是什麼剛出生的孩子,八九點的太陽。其實根本不是這樣的,這個程序我打磨了3年,這三年我一
直在不停地調試著它,我想說,現在的這套思路,已經達到了它的上限,在這裡有一個無法突破的瓶頸,整整困擾了我三年,我無論怎樣對它進行修改,它都無法再
提升些什麼了。我曾經發誓,只有這套程序能夠贏下我,我才會讓它來這裡闖蕩江湖,可是最後我放棄了,在它贏下我那盤棋的最後,我選擇了一個明顯錯誤的走
法,我熬了三年,熬不下去了。」


「我曾經夢想著成為一個頂尖的職業棋手,就像貴賓席上的各位大前輩和昔日衝擊職業道路上的戰友們一
樣。我常常在想,站在巔峰的棋手,面對棋盤是什麼感覺,不能夠站在那樣的高度感受圍棋,是我一直以來的遺憾。這也是我為什麼想要去編寫這樣的一套程序,我
想通過這樣的方式,來探索圍棋的深奧幽玄。」


「只是依然很遺憾,這一套程序的每一個細節我都努力到調試到最好,其實力卻依然無法觸及到圍棋的奧秘,不說職業的最高峰,就是業餘頂尖棋手,也能穩穩地贏下它。這一套演算法無論再怎麼改進,只要本質不改變的話,最多只能提升一先的水平。」


「棋
盤上充滿需要判斷的東西,比如挑起戰鬥。戰鬥是否可行,戰鬥是否必須,戰鬥是否能夠得利,這一切都需要衡量全局,我努力想要構建起對於單個的棋子的衡量標
准,但是每一個棋子所獲得的信息都被它自身所局限;我根本沒法構建這樣的一個衡量標準,這根本不是我能做到的,這需要一個找到『圍棋的本質』的人才能做
到,我想要找到『圍棋的本質』,但是我對它一無所知。你們看見了吧,這是一個死循環。我要放棄了,這一次的比賽勝利我很幸運,謝謝大家。」


沉默數秒之後,現場掌聲雷動。



程工程師的掌聲在表達對於這份軟體的敬意,但是對於這位獲勝者的宣言,他們並不以為然。他們相信電腦的力量,其實他們相信的並非電腦的力量,而是自己的智
慧,圍棋再玄乎,也是人下出來的,只要是人能夠想出來的,就理當能夠被歸納出來,以最簡潔優美的方式從思維之海中提煉出來。


而棋士
們並不真正理解這份軟體,他們的掌聲送給了這位業餘棋手對於圍棋的敬意,對於圍棋本質的探索,和對於自己清醒的認知。同樣的,他們相信的也是自己的智慧,
這種智慧是人類精神的延續,綿延了無數代的圍棋技藝正在他們的手上變得更加爐火純青。面對著來自二進位世界的一切,他們依然相信,圍棋這座複雜的迷宮,想
要通過這座迷宮,需要的是「人」的力量。


這其實是人類智慧和人類智慧的較量。而現在,他們在晚宴上舉杯相慶,交談歡愉。


他堅信自己已經對這場較量做出了預言。


他不停地應付著人們的敬酒,贊助的企業家,編程界的前輩,還有各位技藝精湛的棋士,甚至連那位白髮蒼蒼的大前輩都在助手的攙扶下來向他祝賀。他感受得到全場的注目,這個屬於放棄的夜晚,也算是他的頂峰。他在杯盞交錯間看著這個世界在明媚的燈光下旋轉,這世界真好。


晚宴之外的走廊上,點起了一支細長的煙。


8


「日出而作,日入而息,鑿井而飲,耕田而食,帝力於我何有哉。」


用腳步丈量自己的天下雖然辛苦,但是堯帝聽見老人們這樣的回答,他覺得一切的努力都沒有白費。那時候堯帝還叫做陶唐氏。


他記得數十年前那場滔天的洪水之前,人們就是這樣生活在大地之上。


洪水。


黃河浩浩湯湯,一切都彷彿跌向共工頭觸不周山的時代,在巨大的自然力面前分崩離析。他還記得鯀,為了解救帶來了神聖的息壤,奔勞九年,鴟龜曳銜,卻在順欲成功之時被邪魔擊殺於羽山;而鯀的兒子禹,接受了自己的任命,又帶領著民眾治水十三年,才平息了這樣的一場大劫。


他還記得在那之後,他委任羲氏與和氏制定了農耕的曆法,看著星辰的走勢,日月的變化,學習著與自然萬物一同生長。


「其仁如天,其知如神。」


只是他還有一樣事情放不下,那就是自己的兒子。


「這張河圖,你已經看了三天,可有悟出些道理?」


「父親,這真的是那張河圖嗎?我只看到了一個個的黑點和白點,它們似乎是按著數字分開的,可是就憑著這一個個的點,真的能像祖先們一樣,窺探到天地的秘密嗎?」


堯默默地嘆了一口氣。


9


這是一隻很修長的手,中指和食指夾住了那支燃了一半的煙。


「何洛,你真的決定要放棄嗎?」那人的手輕輕地在煙灰缸上一捻一轉,熄滅了那支煙,還未燃盡的煙灰輕輕飛起,他看見了那人的臉,很乾凈,看起來平時有很好的護理;笑容很標準,是那種歷經考驗的笑容;加上那身標準的黑色西服。像極了電影裡面閉著眼睛開槍的特工。



這裡我們需要加入一些狗血的劇情,每一個故事裡都會出現的生硬大反派,或是潛藏在暗處的不能見光的勢力,他們需要有統一的深色制服,有時候需要一副墨鏡。
他們總說,有陽光的地方就有黑暗。那麼這個無端出現的黑衣男子究竟會是一個怎樣的人物呢?讓我們來看看他所具有的特徵吧,他有著修長的手指和乾淨的面容,
笑容久經考驗。


深黑的制服?殺手?但是為什麼有人要殺死一個寫圍棋程序的程序員呢?修長的手指?或許他是一個鋼琴家呢?但是一個高貴的鋼琴家為什麼要來找一個寫圍棋程序的程序員呢?


或許你要問,為什麼需要這些狗血的劇情呢?


並沒有別的原因,這一切都是我們的主人公(他現在有了名字,叫做「何洛」),他腦海中所想到的場景。在他還沒有來得及抓住它們的時候,這些思緒就已經揮發而去。這在某種程度上,就是人類思考的方式——意識的潛流就在你雙眼看不見的地方卷涌而起,托起一個結果浮上冰層。


而現實之中往往並不會有一個生硬的大反派,這就是人生變得複雜的原因。


「如果這裡還有一個機會,你會願意重新開始這項研究嗎?」


「我說過這是我的極限了,我對於自己的判斷一向很準確。」他覺得有些發暈,大概是殘酒未消的緣故,他顯得有些搖晃,這讓他並不能保持住之前那樣的微笑而又冷靜的氣場。


「我來自G公司,從這次大賽知道了你確實具有出眾的才華。想要讓你試一試。我們覺得有機會。」


「G公司,那又怎樣?你們確實很強,但是博弈軟體並非你們的特長領域。」


「說到G公司的時候,雖然只有短短零點幾秒,但是你的瞳孔確實放大了,眉毛也不自覺的動彈了一下,讓我們直接切入主題吧。」


「你們有什麼?」


「深度學習系統。」


一片沉寂。


10


「可…你們自己的程序員都不知道它是如何運作的。」


「曾經,確實是這樣。或許,現在也是這樣的。但是這並不重要。」


深度學習系統,他還記得G公司的當年的報道:


2012
年 6 月,紐約時報曾報道了G公司如何通過向「DistBelief」提供數百萬份 YouTube
視頻來讓該虛擬神經網路系統學習貓的關鍵特徵。這套系統的創新之處在於,它可以在未事先獲取「貓的特徵描述」信息的情況下自行總結出貓這個概念的特徵。也
就是說,DistBelief 具有自學習能力。當然,這套系統的運算能力也非常的龐大,由 1000 台機器組成,共包括 16000
個內核,處理的參數高達 1000000000 個。


這套系統採用分層機制工作,神經網路的最底層可偵測圖像顏色變化,再上一層則可識別特定類型的輪廓。在增加若干後續分析層之後,系統不同的分支會為臉部、搖椅、計算機等對象生成檢測方法。



夠做到這一點,當然很了不起,據說這套系統讓它的技術總監感到震驚的是後來,後來它在視頻中識別出了碎紙機,而這一點他思索了很久都不知道如何編寫程序做
到。而這意味著研究人員已經無法說清楚究竟這套系統是如何識別出特定對象的了,因為程序看起來已經有了獨立思考的能力,其複雜的認知過程是不可預測的,雖
然這種「思考」能力仍局限在非常狹隘的範疇。


在那之後他並沒有再聽到關於G公司的深度學習系統的消息。


沒有消息就意味著沒有進展。現在他恍然大悟,自己實在是太天真了。一個事物的憑空消失必有其隱情。


「它現在有多厲害?」


「我們能和它交流了,非常簡單的那種。我們嵌入了一個程序,我們把它叫做『斯金納箱』。你應該知道吧,這就和條件反射一樣。」


「但是它的獎勵是什麼?」


「新的數據。」黑衣男子搖了搖頭,「我們都叫它『greedy boy』。對新的數據非常渴望,它彷彿在利用那些數據建立新的『聯結』。你知道的,這就像是它正想要構建一個新世界——在它自己的內部的新世界。」


「它會…像母體一樣嗎?」他的聲音有些驚恐。


「這倒不可能,它是被物理隔離的,數據都是通過一個中介傳遞的。而且它也沒有武器啊。你關注的點真偏,科幻小說看多了吧。讓我們來說正事吧,這個深度學習系統,或許能夠突破你所說的圍棋演算法的瓶頸。」


「你是說讓它自己歸納出一套演算法?就通過分析棋譜嗎?這可比懂得如何分辨碎紙機要難很多,很多很多。它通過棋譜,找出的只是棋子存在的法則,簡單的吃子手段,最多也只能夠找出局部的定型。」


「這就是為什麼我們需要你和你程序。我說過,我們要能夠和它做交流了。我們需要你的程序,做它的對手。」


11


堯對著那張河圖看了整整一天了。



一次國家遇到危機的時候,他就會看著那張河圖,陷入沉思。河圖裡一定有解決問題的答案。雖然那答案正潛藏於某個未知深淵之中,但是他並不畏懼,他相信河
圖,更相信萬物生滅的規律。他還記得第一次見到河圖時的震撼,他的童年就和這張圖相關,父親要教會他從這張河圖裡,看見日月星辰,看見四時晴雪。當他終於
看見了這一切,他才真正成為帝氏的繼承者。


現在的他又對著河圖,這一次他愁眉不展,愁的不是國家,而是自己的孩子,丹朱。作為帝氏的繼承者,他並沒有像自己一樣,擁有繼承這張河圖的天賦。這一張河圖的智慧,該如何交付給自己的孩子呢?


河圖沉默無言,夜空群星閃爍。他望著天空中無數星星交相輝映,天穹緩慢的移動著。


「河圖的種種變化,我能看見,別人卻看不見。正如這天上的星星,倘若不經過持久的觀察,怎能看出這星河的流動呢?如若我能夠讓丹朱體會到河圖中的變化,而非靜止,那這一切就迎刃而解了。」


「這一切都要從『無』開始……」


「堯造圍棋,以教子丹朱。」


——張華·《博物志》


12


何洛看見深度學習的時候還是被嚇了一跳。


這才是真正的蟻群。


當巨大的計算機組像是古羅馬的重型兵團一樣展開在自己眼前的時候,沒有人不會想去相信人工智慧的存在。


何洛整理出的浩如煙海的棋譜庫,第一次有了泥牛入海的感覺。


「為什麼你們想要挑選圍棋作為『對手』?」


為什麼IBM要挑選卡斯帕羅夫呢?你知道的,博弈的遊戲,輸贏意味著一切,而找到最強的招法,才能夠立於不敗之地。沒有人不想立於不敗之地。」


「那我和你們不一樣,我說過了,我只是想看到最好的圍棋。」他說完轉身欲走。


「那,」黑衣男子頓了頓,「又有什麼區別呢?」黑衣男子說完便走,他是真的離開了,扔下的那張名片在風中搖擺,在一秒鐘後落到了地上。


最終何洛還是來了。


剛才的他已經把自己的程序和「斯金納箱」連接起來。「『Greedy Boy』,show me something.」他心裡默默念著。


但是真正的「對戰」還沒能開始,這場對戰,需要等知道「圍棋」是什麼之後,才能夠開始。


他現在正一點一點把他所收集到的一切棋譜數據存入這龐然大物之中。


而在屬於自己定義的內容里,他一遍遍的輸入,一遍遍的刪除。到最後,他甚至沒有留下關於「生死」的概念,就按下了回車鍵。


一個月之後,研究人員發現計算機給出了圍棋的基本規則。


「比我們想像得要慢很多。」他說起這句話的時候不知是得意還是失落。


終於要到對戰的時刻了。


13


電腦給出的程序,和何洛的程序正在內部世界裡廝殺著。


但是這時的何洛卻並不在G公司。他在半年前,「對戰」計劃開始的時候就選擇了退出,現在的他正在沈老師的棋院里教棋。


「何老師再見!」「何老師再見!」


這天下午他送走了可愛的學生們,坐在教室里沏了一杯茶。他喜歡在這個時候,下午4點鐘,打一局秀策的棋譜。在擺完那步「秀策的小尖」之後,他意識到有人已經站在門口好久了。


「你所害怕的事情並沒有發生。」


黑衣男子這次依然穿著黑色西服。


在這裡打斷一下,作者並沒有想要借黑色表達什麼,他只是覺得如果換成白色或是其他顏色的西服或是背心,會造成指代不明的困擾。


「勝率曲線依然在50%波動,看起來,『對戰』沒有贏家。」


這突如其來的結果讓他覺得有些荒謬,即便是如此巨大的蟻群也無法創造出一個圍棋「上帝」嗎?


「帶我去看看。」不知為什麼,這件事情讓他感到更加的害怕。他還記得自己退出的理由——「我無法接受,電腦真的成為圍棋『上帝』的時刻。」不知道為什麼,現在的他同樣覺得害怕,他害怕這小小19路的棋盤就這樣的深不可測,這讓他對於了解世界喪失了信心。


而在24小時後,他看到了兩個程序對戰的棋譜。


他默默地拿來一副圍棋,一子一子的擺出了這一局。當他把最後一子擺完,棋局終了的那一刻,他雙眉緊鎖。


「我最害怕的事情還是發生了。」他的一聲嘆息輕如羽毛,「從這份棋譜看來,並非是『深度學習』停在了業餘5段,而是『對戰』的雙方,都達到了九段的高度。看起來,我那個放在這個『巨大蟻群』中的程序也被『深度學習』給改良了。」


他想要站起來時感到一陣暈眩,對著那片計算機組的方向,重重地跪在了地上。


14


宇宙洪荒。


他已經在大河沿岸行走了整整十年,只不過,他只記得一個又一個的日出與日落,有些時候他想念太陽,有些時候他想念雨水;他看見過一隻鹿躍動而過,他看見菖蒲草生長,菖蒲草衰落。


這個世界正在慢慢的變得完整,能量從遙遠的天邊不絕如縷地湧來,把這個世界裡面的一切細節填補得乾淨完整。


這天他吹著河風,感受著天地間生長的一切。


突然間風起雲湧,一片墨色的雲從東方趕來,一道閃電把天空劃為兩邊。天地露出了幽玄的顏色。


他看見一匹龍馬躍升出水面,在那翻滾的波濤里他看見了——


河圖。


「何洛,你醒醒。」他醒來時發現黑衣男子扶著自己,「你怎麼突然就暈倒了啊,還好只是一兩秒。大概是『對戰』計劃成功,你太開心了吧。哎呀,我們也沒有想到,居然會是這樣的結果,居然連你的程序都變得如此強大,我們居然只看到勝率卻沒有去看棋譜,這真是…」


「你們的『斯金納箱』是給了『深度學習』多少獎勵?」他的語氣顯得很是急促。


「那要看它們對弈的局數了,估計很快就能統計出來,但是所有的數據都是來自G總部的雲存儲中心,我們為每一局設計了一定的比例,具體的我忘了,怎麼了?」


「在那裡面,」他又看了一眼那巨大的計算機組,「大概是我想多了。」


不久之後,G公司組織一場曠世的圍棋大賽,由「深度學習」對陣圍棋的世界冠軍。這一場比賽吸引了眾多的眼球,所有的人們都期待著這一場「對戰」的結果。在上午10點,電腦的操作員在本榧棋墩上落下了「深度學習」的第一手棋——位於棋盤正中的「天元」。


這開局的一手在現場引起一片嘩然。而他似乎很平靜,他彷彿看見這手棋很早之前就在計算機錯綜複雜的線路中心落下,就像是一個宇宙大爆炸,一個開始。


他突然想起,他站起身時的那陣暈眩,在那道炫目的光線里,他看見了一隻睜開的眼睛。


能不能戰勝李世石不好說,不過...

這一天遲早會到來,但我並不認為這是AI戰勝了人類,而是人類戰勝了人類自己罷了。AI在某些項目上戰勝了人類選手,並不會關乎人類的尊嚴,硬要我說反倒應該讓人類感到驕傲才是。
圍棋說到底也是一款智力遊戲,比中國象棋、國際象棋計算體量更大而已。隨著電子技術的發展和演算法的精進,機器人或AI能夠逐步替代人類在體力勞動和腦力運算上的工作,這樣解放生產力的大好事值得我們歡欣鼓舞。至於AI的「替代」極限會到哪,我也充滿期待。

我想起了《最強大腦》,不可否認選手們的能力確實超乎常人,但我看完之後並沒有感嘆自己跟他們的差距,我反倒變得樂觀起來。因為很多挑戰,如果給我一張紙、一隻筆,如果沒有那麼嚴格的時間限制,一個正常人也能做到,更何況我們有越來越強大的計算機等工具。在這裡我並沒有貶低他們的意思,我只是想說,現代科技讓我們無論從體力還是腦力上都大大超過了人類的極限。
所以,學會如何利用工具、如何讓工具更好地發揮作用而不是發揮副作用、如何學會在新時代和人類、機器交流,才是我們應該努力做的。
AI將會給我們帶來變革,就在不久的將來。


在人工智慧故意輸給人類前,都不用慌


這幫傢伙膽子小,有本事先挑戰柯潔。

最好是讓中日韓各派一個上車輪戰,或者乾脆Google辦一個圍棋比賽,每年的前三名產生出來以後,立即來單挑戰這個AI。

這才能夠驗證這個演算法是否真的理解了棋理。

比賽用時也是個問題。雙方各一小時,然後一分鐘讀秒。這個時間比較短了。如果用現有的慢棋比賽賽制,每方2-3個小時時間可能更合適,因為時間短了人容易犯低級錯誤,而電腦犯低級錯誤的概率小。

-------------------------------------------

這裡完全沒有小瞧李世石的意思,只是他現在真的不是巔峰期,明顯有比他狀態好的棋手。

從AI的角度來說,如果真的有演算法完全理解了棋理,應該是一個一致性好的演算法,可以針對所有棋手保持高勝率,而不是針對某個棋手,所以即使贏了小李,AI是否就超過人類還是存疑的。但是如果能夠對中日韓的頂尖高手保持全勝,這個AI就真的無敵了。

那麼人類的下一步要做的就是改規則了 :)

--------------------------------------------------

小李表態了,看來小李也覺得一小時太短了點,提出要兩個小時。
李世石:AlphaGo和我差2子 我絕不會輸
  「最早主辦方向我提議每方1小時。我覺得用時會成為變數,就向主辦方提出了每方2小時。但是,用時越短,未必計算機就無條件有利。我覺得每方2小時很充分。」


=========================
最後確定比賽時每方兩小時,對於小李,有這個時間應該不太會犯錯誤了。真是期待實戰啊,要是有人掛盤講解就好了。


人機大戰細則出爐 李世石最多拿到125萬美元
比賽用時每方2小時,1分鐘讀秒三次。比賽採用中國規則,黑貼3又3/4子(黑貼7目半)。


看了這條消息,我的內心確實十分激動和感慨。我是棋手,也對計算機科學領域比較感興趣。記得兒時學棋的時候老師說「棋感」很重要,要多下才能明白圍棋里蘊含的一些道理。下了可能有十年棋了,我對於這番話深以為然。然而今天google團隊試圖證明「棋感」也是可以被量化的,被計算的,這在圍棋的發展中便是一個里程碑的時刻。而對於人工智慧領域也一定是個裡程碑的時刻(畢竟上了Nature)。我對deep learning了解不多,前些天和朋友一起去聽了一個科技講座,我的大致認識是deep learning優化了傳統基於神經網路的機器學習樣本提取效率,使得電腦更容易找到一個合適的,全面的「評估函數」。可以想到通過deep learning和MCTS(蒙特卡洛樹搜索法)來設計的演算法一定較之以往的簡易圍棋AI有了很大的飛躍,但是就事論事的話我仍然認為李世石先生勝的幾率很大。我大致瀏覽了一下AlphaGo的這五局棋譜,發現除去第一局外二到四局全部都是Fan Hui中盤負,中盤負棋勢已崩。那麼根據圍棋AI的評估函數演算法,AI基本不可能下出無理手或是很用強,那麼下成最後這個我猜想是樊先生心態發生了些許變化,導致棋下的薄了。後來回到宿舍在Nature官網查看了他在局後說的話:「Losing was very hard. Before I played with AlphaGo, I thought I would win. After the first game, I changed my strategy and fought more, but I lost." 我想這個「fought more」兩詞解釋了為何連續下崩。在我的認識里,圍棋AI應當是精於計算而對於一些模稜兩可的厚薄轉換之類的可能並沒有人類那麼敏銳。想到這裡我不禁回憶起了羅洗河先生和崔哲瀚先生下的三劫轉換千古名局,在我的主觀認識里這樣的轉換便可能是「評估函數」所無法評估到的,也是人類目前更強的地方。況且根據google論文自己的評估,目前AlphaGo的實力只在職業二段左右,無疑二段與九段之間的實力甚為懸殊,雖然AlphaGo尚有一個月時間學習,但是假設圍棋的技巧是有限的話,我想無論是人學習還是機器學習一定是一條漸近線,而目前來看人類明顯更精於學習一點。所以我認為三月李世石先生能贏。


想想量子計算機訓練出的深度模型是可怕;但是,那種普遍適用的『聖杯』,未必如此輕易被得到吧。人類,too naive, too simple。


關鍵在於人工智慧

人工智慧是人類夢寐以求的終極萬能自動機。各國政府積極推動的人工智慧項目,IBM、Facebook、國內的Baidu等等幾乎所有的大型互聯網科技公司都想從這癢點獲得領先,無奈谷歌「作惡」手段更為高超。
人工智慧微小進步都意味著巨大的商業價值,任何讓人們覺得接近人工智慧的技術都將獲得巨量資金的熱捧。這才是這件事情的要義。做為一家公司,谷歌這次的活動上雜誌和約人PK都是一個商業公關活動,最主要的目的是在於提升品牌價值,尤其是其新建母公司。

人工智慧到底有多厲害了?谷歌公司甚至願意專門為這門技術從新成立母公司來掃清公司架構障礙,IBM之前類似的人工智慧項目Watson就可以很好的說明問題:

(別瞎戳滑鼠,只是張圖片)

圖中間的就是IBM Watson形象(界面+ +)
正在與人類展開一個全美流行的智力問答競賽節目,此時IBM Watson正遙遙領先對手。想不想看看這傢伙的真身?

看到側面一臉大寫的POWER7了么,掌握核心科技,安利起來就是無敵,這貨配備了90台Power 750 伺服器,能在三秒內查詢一百萬冊的圖書。而在這場和人類的較量中,機器主要的亮點在於人類自然語言處理。不久之前計算機對人類語言處理還是格格不入,經常驢唇不對馬嘴,而近幾年大量的應用都已經表明,這方面的技術已經得到了長足的進步,包括公眾可以直接接觸到的各種語音應用,以前這些表現都是匪夷所思的。當前機器語音識別在許多方面甚至超越了人類。在複雜環境下的多語音同時識別。識別之後的翻譯以及理解。自然語言處理和語音識別技術可謂竿頭直上,進步飛快!

來看Watson處理問題的大致流程:首先解構語句,然後開足馬力來收集資料。在節目中Watson使用的是內置資料庫,但事實上Watson可以很方便接入更多資料庫,甚至互聯網路當中。

Watson會收集許多與當前處理問題相關的關鍵字的文本,這一個步驟它只做儘可能多的信息收集工作。

之後進行語意分析,看看這些相關的信息裡面都說了些什麼?把這些文本中的最終意圖累計起來。

最後進行一次舉證步驟,也就是根據上面累積的文本意圖累計量,看看哪個可能性更高。
Watson在智力遊戲《Jeopardy!》中戰勝人類的時間時2011年。此後更不斷進步在金融、醫學甚至石油勘探方面都取得了一些成就。也像科幻片中描繪的那樣Watson也能幫助人類解決社會治安和犯罪問題。2015年時它已經在17個國家的75個產業中發揮了作用。嘿嘿嘿。。。

對了,前不久IBM 開放了部分Watson的 API用來(xiu)造(ji)福(rou)人類。

人工智慧是盤大棋,是全人類的一個拐點,是一件大事。2015年1月份,Facebook首當其衝做為上市商業公司開源了其人工智慧機器學習框架Torch7 。2015年11月10號 Google公司開源了機器學習系統 TensorFlow(1)。一周不到也就是2015年11月16號,美國巨硬公司也宣布開源機器學習工具包DMTK(2)。緊接著2015年11月23號,IBM藍色巨人也就是上面提到掌握核心科技自帶POWER7的Watson東家也開源了SystemML機器學習系統。

這些上市企業前所未有對人工智慧開放和對機器學習投注,這個山頭的重要意義也就不言而喻。從另一方面也能夠看到各大廠商對人工智慧技術的興奮溢於言表。還有一點,這些公司開源也是為了技術能夠變成民用事實。大家都不希望政府一紙文書讓這些項目都變成秘密計劃,拖慢技術進步(這點是猜的)。所以最好的辦法就是把研究成果公之於眾讓所有感興趣的人一起貢獻智慧。在這種大前提下,人工智慧不得不大步向前。果不其然Google公司憋不住了放招出來了……^_^

(1)Google開源的非分布版本機器學習系統
https://www.tensorflow.org

所有圖片均來自互聯網(圖侵刪)

原文同步發布到專欄:
http://zhuanlan.zhihu.com/lllab/20550031


這只不過是又一個設計的更精巧更有效的神經網路而已,唱人工智慧威脅論的各位還是歇歇吧。。圍棋本質上就是一個搜索問題,只不過搜索空間特別大而已,以前的電腦硬體match不了這個問題,但是隨著硬體計算能力,速度的發展,總有一天可以擊敗人類的。人類智慧的驕傲還是不要從這找了,多從人文,藝術,美學這些方面找找吧。


剛才看了一下棋譜,ai有一些地方很不注意細節,虧個1,2目挺多的,甚至有一手倒貼目後還得自己補活,上升空間還是很大的。歐洲冠軍的含金量暫時不評價。5局棋中基本沒有大規模轉換。這塊最能檢驗ai水平。還有這次比賽是數子規則,想知道ai粘劫收後或者面對盤角曲四加雙活是什麼反應


在深度學習搞定人臉識別,以及deep mind訓練計算機玩像素遊戲的時候。我就知道,ai在圍棋上打敗人類指日可待。毫無疑問。

然而,現在的階段只是ai發展的啟蒙階段而已。以後必有更加強力的理論來支撐目前的結果,從而完整達成第一階段:智慧不再是人類專有,而是一種可以被複制分解定向增強的技術。

希望一切進展的快一些!!


我都有點難過了。。樓上有沒有懂棋的啊!我不要看小說啊!在車上大概看了下棋譜,看著差距挺大的,我覺得以樊麾二段的水平根本不足以衡量alphago的真實水平,唯一第一盤贏2.5目,你說AI它用全力了嗎,也許它已經計算出穩贏了,採用了最平穩的走法,而且還可能在收集對手行棋習慣,因為這個AI有學習能力。
我好害怕,我想靜靜。還有點難過.. 我爸的消息

—————————————又是分割線
半夜看到的新聞,這一天比我想像中來得快多了。

這幾年沒怎麼看過棋,不知道當今頂尖的棋手比四年前強多少。也沒有仔細看alphago和樊麾二段的棋譜,之前也只知道厲害的AI能和高水平業餘棋手平分秋色,但確實圍棋職業棋手和業餘棋手仍有極大差距,樊麾是個多年旅歐棋手,哪怕是歐洲冠軍,也只算是職業棋手的低段水平,但無可否認,這是極大地突破。新聞說3月份會和李世石下,到時就可以看得出和世界頂尖選手的比較了。
但是最令我好奇的是這個Al的設計策略,我不是很了解,單據新聞里看,他的設計策略已經很接近人類的對弈思考了,計算機的計算能力早已經大大超過人類,但用窮舉法的策略設計圍棋AI起碼是極大地浪費,就像是棋手有棋感,在特別是當局面四平八穩的時候來做選擇,這之前對於圍棋AI是很難做到的,當然也可能受限於設計者的圍棋實力。這個AI已經接近人類的思維方式,再加上驚人的學習能力和不會出錯的計算能力,如果設計上沒什麼別的缺陷了,還有一個月,足夠它學習的了。越想越懷疑,我不確定李世石是否能贏。
個人看法,圍棋是很符合人類思維方式的棋類遊戲,這點上我覺得還是完全領先別的棋類的。相比競技體育和電子競技在考慮策略的同時還需要執行力,圍棋完全就是思維方式的訓練和較量,用思維和計算進行博弈,如果AI能夠在圍棋上戰勝世界頂尖選手,那我覺得比較具象化的思考判斷AI已經可以達到甚至超過人類水平了,後面需要做的就是像學習圍棋一樣學習別的技能,設計者要做的就是設計符合具體情境的策略。
有點激動,也有點恐懼。大概電影看多了..
以上均是個人理解,比較淺薄,見諒。


談論這位2p實力和頭銜不符,以及頂尖選手有多強的人根本沒抓住重點。
以前我們認為圍棋AI光靠「計算」是無法擊敗人類的。和象棋等不同,圍棋術語有很多「味道不好」 「愉快」 「痛苦」這樣的詞,我們認為這是圍棋的精髓,是計算機無法掌握的。
所以之前的AI也的確只有基礎格式和計算能力,根本沒有辦法突破境界,永遠都被嘲笑。
但目前AI的「深度學習」設計方法,以及其表現出來的實力,已經跨越了這個境界,同學們,如果AI也能掌握人類所謂的「感覺」,那人類還能贏嗎?時間而已!


推薦閱讀:

RL兩大類演算法的本質區別?(Policy Gradient 和 Q-Learning)
在圖像識別這一塊,目前有沒有可以移植到嵌入式設備的深度學習演算法?
深度學習調參有哪些技巧?
你有哪些deep learning(rnn、cnn)調參的經驗?
把深度學習作為自己的碩士課題,有什麼可以做的?

TAG:人工智慧 | 圍棋 | 計算機科學 | 深度學習(Deep Learning) | Alphabet |