從孫子兵法看人機大戰

近日,人工智慧圍棋AlphaGo捲土重來,與當今圍棋第一人「柯潔大棋渣」(柯潔以前的微博名)正式開戰。

2017年5月23日,第一局,柯潔執黑以1/4子落敗。

2017年5月25日,第二局,柯潔執白中盤再次落敗。

明天,第三局,柯潔將執白對AlphaGo進行最後一戰。

因為對圍棋和科技的雙重熱愛,從去年AlphaGo首次登台對戰韓國棋手李世石開始,查理君對此事就一直非常關注,因此一直想寫點東西留作紀念。

今天早上,將醒半醒之際,懵懵然回顧了整個事件之後,竟然漸漸發現過往那些點點滴滴的細節,似乎有著某種隱約的聯繫。

最後,查理君恍然大悟:這個可怕的對手 —— Google,不但實力強大,丫還懂兵法!

怎麼說?且聽查理君一一分析。

先勝後戰 vs 先戰後勝

孫子兵法的核心思想之一是「先勝後戰」,意思是說,在開戰之前,一定要先計算整個戰爭的勝算是多少。只有勝算高過對方,再去尋求和敵人作戰。如果勝算不高,就不要和敵人開戰,那是自取其辱,甚至自取滅亡。「勝可知,而不可為」,勝利不是打出來的,而是算出來的!

我們看看整個人機大戰中,Google是不是「先勝後戰」?

一直到去年3月9日,人機大戰正式開戰之前,整個圍棋界對AlphaGo有多少勝算都沒有定論。網上什麼說法都有,有預測5:0的,有預測0:5的。李世石甚至說:「輸一盤就是失敗」。可惜的是,所有這些預測,都不是建立在真正的「算」上面,而是一種盲目自信或憑空猜測。如果說旁觀者預測錯誤情有可原,但是身為對戰方之一的李世石,居然對對手的實力毫無了解,實在是不應該。

查理君記得一個細節是,直到開戰前最後一刻,李世石才從Google總裁口中聽到一點關於AlphaGo實力的情報。可以看出來,當知道AlphaGo的強大實力之後,李世石的心態和情緒發生了微妙變化。

反觀AlphaGo一方,先是找到歐洲圍棋冠軍樊麾進行實戰比賽,後來又乾脆邀他加入團隊一起完善AlphaGo。在去年開戰之前,查理君就聽到一些傳聞,說根據Google內部人士估算,李世石的勝率為0!

李世石勝率為0,這是什麼概念?!

記得3月9日第一場比賽結束那一刻,可以明顯看到李世石的手一直在發抖。李世石本來抱著必勝的信心,如今卻遭受如此殘酷打擊,可想而知有多麼痛苦,這對他以後幾局的發揮也必然造成了非常不利的影響。而且更可怕的是,他的對手是一個勝利了不會驕傲,失敗了也不會灰心的機器。

先戰而後求勝,將圍棋界置於多麼不利的境地。

幸運的是,李世石第四盤的神之一手,無疑給圍棋界贏回了一點面子,帶來了一點希望。

知己知彼 vs 盲目輕敵

「知己知彼,百戰不殆」,這是孫子兵法中最膾炙人口的一句名言,可是在這次舉世矚目的人機大戰中,我們只看到了Google的知己知彼,從未看到圍棋界知己知彼。

第一代的AlphaGo,是以人類專業棋手的16萬局棋譜做為訓練數據的,可以說,AlphaGo對所有人類職業棋手的歷史戰績都瞭然於胸。

反觀圍棋界,從李世石到柯潔,又對AlphaGo了解多少呢?

先說李世石那一戰。

當然,這主要怪敵人太「狡猾」。在戰前,Google沒有給任何外界人士接觸AlphaGo的機會,圍棋職業棋手手中關於對手實力的唯一信息,就是樊麾對戰AlphaGo的那5盤棋。AlphaGo每天都在自我對弈上百萬盤,可以說每分每秒都在以飛速進化。而公開對戰樊麾的5盤棋,唯一的作用就是,成功地讓所有圍棋職業棋手誤判對手實力。記得當時很多棋手都曾經認為,AlphaGo就這樣的水平還想挑戰李世石?

孫子兵法開篇就講:「兵者,詭道也。能而示之不能,用而示之不用,近而示之遠,遠而示之近」。

AlphaGo的實力可能早已強大到能戰勝職業九段了,但Google給你看到的卻是,AlphaGo對戰職業2段(樊麾當時是職業2段)似乎也勉勉強強。

這不正是「能而示之不能」嗎?

毫不誇張的說,Google從一開始,就從整個戰略的高度,為贏得最終勝利打出各式各樣的套路。

再來說柯潔。

2016年12月29日,一個叫「Master」的ID突然出現在圍棋對戰平台「弈城」上面,註冊國籍是韓國。

這個ID上來不發一言,只找平台上最頂尖的高手下棋,而且是30秒一步的快棋。

第一天,對戰謝爾豪4段,中盤勝;對戰孟泰齡6段,中盤勝;對戰於之瑩5段,中盤勝.....連勝5位職業棋手。

第二天,對戰韓國第一朴廷桓9段,2比0;對戰名人戰冠軍連笑7段,2比0;對戰傳說中柯潔的ID「吻別」,2比0.....

第三天,對戰百靈杯冠軍陳耀燁9段,2:0;再戰朴廷桓,2:0;對戰應氏杯冠軍范廷鈺9段,大勝......

短短几天,這個ID居然敢跟所有中韓圍棋高手對戰,一戰未敗,連勝30場!

這是不可能的!這是只有電影中才會出現的情節!

人們紛紛猜測,要麼這是韓國研製出來的新狗,要麼就是AlphaGo本身。

直到最後,在跟聶衛平的對局過後,謎底才揭開,這個ID最終發話:「我是AlphaGo的黃博士」。

黃博士,就是那個穩如泰山、一動不動的千年機械臂 —— 黃士傑。

很明顯,這是一次有預謀的測試,目的就是為了跟職業圍棋高手實戰測試新版AlphaGo的棋力。輸了,無傷大雅,反正不是正式比賽。贏了,證明了這一版AlphaGo在正式對戰世界級職業圍棋高手,不會有什麼太大風險。

而圍棋界呢,棋手們所能知道的,仍然都是Google讓你知道的。當然,這次好點,棋手們有了60張實戰棋譜可供參考。可惜,這次來和柯潔對戰的,既不是第一次對戰李世石的版本,也不是大戰60回合的Master,而是經過全新架構和調整的新版AlphaGo。你剛剛知道了點對方的真實情報,沒想到人家又變了。

知己知彼,Google不但做到了,而且變著花樣做到了。

勝於易勝 vs 艱難求勝

孫子兵法曰:「善戰者,勝於易勝者也」,意思是善於打仗的人,都是打容易勝利的仗,而不是去打很難打的仗。

為什麼Google第一次挑戰要找李世石?

人人都知道職業圍棋手都有自己的巔峰時期。當年的李昌鎬獨霸棋壇16年,直到李世石橫空出世才走下神壇。李世石當年也是天下無敵,直到崔哲瀚、柯潔等新一代棋手崛起才慢慢衰落。而今天的當紅炸子雞柯潔,也早晚會有走下巔峰的一天。

江山代有才人出,巔峰不再奈若何。

Google選擇挑戰李世石,想必也是認真權衡之後的巧妙策略,是孫子「勝於易勝」的思想體現。

第一,李世石名望仍在,戰勝他可以獲得很好的宣傳效果;

第二,李世石巔峰已過,挑戰他的成功概率更高。

到了今天,當AlphaGo已經進化到能夠對戰AlphaGo Lee(對戰李世石的版本)讓3子的水平之後,才來挑戰柯潔。

讓3子是什麼意思?

柯潔對此發了個圍脖:「簡單的解釋一下就是一人一手輪流下的圍棋,對手連續讓你下三步...又像武林高手對決讓你先捅三刀一樣...」。

所以,對於Google來說,兩次都是「勝於易勝」。對於圍棋界來說,兩次都是「艱難求勝」。

要不然,為什麼不讓柯潔和「AlphaGo Lee」來3盤呢?

團隊作戰 vs 單槍匹馬

雖然孫子兵法中沒有專門論述團隊作戰的篇章,但是其思想無處不體現團隊作戰的思想,畢竟戰爭只能是團隊間的競爭。

人機大戰,表面上看,是李世石和AlphaGo比賽,是柯潔和AlphaGo的比賽,但實際上是圍棋界和人工智慧界的比賽。

在人工智慧這一方,Google的財力雄厚,技術強大,人才濟濟。而圍棋界這一方,雖然佔據了「人類」制高點,但是在財力和技術方面,都處於劣勢。但圍棋界最大的劣勢,還在於其意識。

記得當年李世石輸掉比賽,獨自一人坐在圍棋桌前,想找人復盤而不能的時候,你就知道,李世石那時是多麼孤獨。

欣喜的是,這方面我們顯然做的要比韓國好。昨天第二場比賽之後,因為演播信號一直沒斷,查理君看到唐韋星和連笑等棋手紛紛走到比賽桌前,和柯潔一起複盤討論這盤棋。那個直播延續很久,雖然聽不到他們在討論什麼,但是畫面卻讓人無比感動。

然而,從整個人機大戰的比賽來看,圍棋界做的仍然是不夠的。畢竟,我們沒有聽到這樣的新聞 —— 中國棋院邀請國內頂尖人工智慧專家加入團隊,共同制定對戰AlphaGo的戰略戰術。

為什麼面對如此強大的對手,關係到圍棋發展歷史的的一件大事,整個圍棋界,似乎只是將希望寄託於柯潔的個人天才和努力?當然,英雄之所以稱為英雄,往往是那種「雖千萬人,吾往矣」的悲壯之舉成就的。但是請記住,戰爭也好,比賽也好,勝利才是最終的目標,贏才是一切。

AlphaGo從來不是柯潔的真正對手,DeepMind團隊才是。

人類最大的弱點

對比AlphaGo,人類最大的弱點就是情緒和心態。一開始盲目自大,發現AlphaGo實力超群之後,又變得盲目悲觀。

在新聞發布會上可以看到,許多人一遍又一遍的問哈薩比斯,為什麼AlphaGo收官會退讓,是不是有意控制?AlphaGo這樣下那樣下,到底是什麼意思?其實,哈薩比斯的回答一直都是非常客觀而且真誠的 —— 沒什麼秘密,AlphaGo就是根據概率來判斷輸贏的,哪一步概率更高就走哪一步。概率,查理君不止一次談到過,就是對可能性的數學量化。如果贏的概率不是100%,就有輸的可能。在第一局的比賽中,AlphaGo如果能贏柯潔更多,而且那樣走贏的概率更大,它一定不會只贏1/4子。

圍棋是一種文化,一種修鍊,一種境界。代表當代圍棋最高水平的李世石和柯潔,雖然身經百戰,但在對戰AlphaGo的過程中,仍然無法克服人類情緒上的弱點,可惜可嘆。或許,只有將吳清源的這種歷經一個世紀磨鍊出來的心態和柯潔這種正值巔峰的超強棋力綜合在一起的人,才能求得對AlphaGo的一勝吧。

這樣的人有嗎?當年的李昌鎬算一個?

結語

當然,查理君說了這麼多,並非有貶低Google的意思,只是給大家一個看待問題的不同的視角罷了。

毫無疑問,Google對AlphaGo的巨大投入,實際上極大地推動了圍棋和人工智慧的發展,因此值得所有人為之喝彩。正是他們的努力,讓我們有幸站在一個新時代的大門口,幸甚至哉!

明天,也就是5月27日,這場棋界盛事就要畫上句號了。柯潔作為圍棋界和人類的代表,其昨日的表現,已經證明了他的天才不是蓋的。所以,對柯潔來說,最後一戰的最好心態或許是 —— 忘掉比賽,享受圍棋。

祝柯潔好運!
推薦閱讀:

AlphaGo跟一條青蛙有什麼區別?|神經網路功能90年代對應仿生學如今就叫人工智慧了?真搞笑
如何以武俠小說的手法描寫AlphaGo(Master)與職業棋手在2017年年初的六十盤對局?
AlphaGo 準備在2017年初復出,據稱比16年3月的版本強很多,人類棋手該如何準備與之對弈?
如果允許悔棋,人類能在 100 年內下贏 Alpha Go/Master 嗎?

TAG:AlphaGo | 柯洁 | 人机对战 |