AlphaGo 準備在2017年初復出,據稱比16年3月的版本強很多,人類棋手該如何準備與之對弈?

2016年11月6日,Demis
Hassabis 在Twitter上說,we"ve been hard at work improving AG,
delighted to announce that more games will be played in early 2017! More
details soon


Demis
Hassabis 幾個小時前在Twitter上說,we"ve been hard at work improving AG,
delighted to announce that more games will be played in early 2017! More
details soon

一、DeepMind說AlphaGo新版本明顯比v18版本的更強(significantly stronger),那麼沒有哪個職業棋手不承認這個新版本是「頂尖棋手實力」了吧,顯然還有不少人會認為AlphaGo已經超越了人類棋手。

二、AlphaGo的棋風是什麼?其實不是那麼容易說清楚,但是有一點應該是公認的,就是價值判斷絕大部分情況下超過人類棋手,它的選擇沒有感情,不是基於棋風,是基於勝率、價值。

職業棋手在準備重大比賽的時候,可以研究對手的棋風偏好,可以準備一些布局套路,對局時可以在一定程度上推測對手的選擇,但這些對AlphaGo都不管用。

當你面對AlphaGo這樣強勁對手,最佳策略就是不斷追求最善的一手,這樣才能最大化勝率。

保持良好的狀態,充沛的體力,不需要有什麼壓力,輸給計算機沒什麼難為情的,我覺得應該給人類棋手多一點用時,如果需要吸氧也沒什麼難為情的,功能飲料有點用,中午休息時來個馬殺雞也許也不錯,哈哈。

如果你想做最佳測試員,找出類似第四局那樣的Bug,另當別論。

有人提到李世石第四局第78手,已經很多專業分析證明過了,那手的確是出乎AlphaGo預料,並導致AlphaGo出錯,但是那算不上神的一手。還有,Aja Huang在6月份的演講中已經提到AlphaGo新版本已經能正確應對那個局面,正確應對下,李世石是難以翻盤的。如果有人寄望於再次利用AlphaGo弱點,可以說機會比上次更渺茫。

================================

@朱棋聖

朱棋聖的回答,我有很多不同看法,例如:

「圍棋除了其模糊性之外(大局觀等),計算仍然是第一要素(另外一個是判斷)。」

所謂大局觀、判斷,我認為都是基於計算,沒什麼模糊的,圍棋變化太多的確不能窮盡,但本質還是計算。計算機能做的都是計算,計算機用各種不同的計算來模擬、得出結果,Deep Learning當然也是計算。

「但是在半開放區域,連環劫(不知道這次AlphaGo解決了沒有)方面,機器思維缺乏人類的靈性方面,就會暴露出來。」

在下圍棋這種事情上,計算機不需要靈性,也不需要討論強人工智慧是否能有靈性,還是計算夠不夠強大的問題。人類的所謂靈性,模糊感覺,大局觀,其實也是計算。

「Deep Zen 19日開始對趙治勳的三番棋,是一場前哨戰(屆時弈客圍棋和圍棋之眼都會有直播),如果趙治勳能夠取勝,將極大提高人類棋手對抗AlphaGo壓迫階級的信心」

據我所知,Deep Zen和AlphaGo相比還差得相當遠,相當於弈城9D和李世石沒法比。

2016年8月底,https://m.facebook.com/story.php?story_fbid=1262113020489933id=100000737417546 Aja Huang說:Looks like with a value network Zen is approaching AlphaGo v13 on the same hardware. 也就是說8月底Zen不過是接近AlphaGo v13,而和李世石比賽的是AlphaGo v18,v18比v13強了很多,可說是讓2子的差距。

====================================

@謝飛魚

「阿爾法失誤率肯定比人類低,這是無疑的。可是大局觀真的比人類強么?巔峰時期擁有超強大局觀和極度精確判斷力的李昌鎬真的不足以與阿爾法爭勝負么?」

大局觀是什麼?在AlphaGo看來大局觀就是計算,主要就是Policy Network和Value Network,「巔峰時期」、「超強」、「極度精確」再多的形容詞也不能改變計算的本質,圍棋爭勝負就是比計算,在有限的時間內(常見的一天內下完的頭銜賽對局規則都落到這個範圍),AlphaGo的判斷比專業棋手強,對局時間越短,這點越是毋庸置疑。如果給棋手增加時間,同時棋手思考時限制AlphaGo的用時,應該能平衡一些。


搞個時限長一點的群毆唄,群毆能提升至少一先的水平。不過這活兒貌似韓國棋手更擅長


如果想贏,那當然是抱團,搞相談棋,而且要給足夠的思考時間,但是這個做法意義不大。如果要測試和頂尖棋手的差距,那當然是和柯潔進行升降十番棋,這個夠刺激,不過對於柯潔是一個摧殘。

我倒是覺得deepmind團隊想辦法開發出一個可商用的版本就目前來說意義更大一些。畢竟現在大多數人都接受電腦超越人類的觀點(甚至職業棋界的主流聲音也是如此),那打敗柯潔這樣的舉動其商業價值就不明顯了,而高水平的商業版本在愛好者群體中還是很有市場的。


這次說不定是讓子棋,從讓一子開始,人類輸了就讓2子,直到人類贏為止


上一次比賽結束後,我就考慮了一下今後的比賽該怎麼搞。

鑒於大部分人都已經認可阿爾法狗的實力超越了人類,那麼現在比賽的目的就應該放在測試狗有多強上面。

最好是抽五六個一線棋手出來組一組共同出戰,時間也要放寬。組員棋風得多樣化一點,比如愛實地的陳耀燁就配個中盤戰鬥的時越,再加個米飯什麼的,最後再搭個老聶。

多下幾盤,個人認為完全可以一戰。

————————————

多說兩句,人類賽前驕傲自大,輸了之後又高呼狗不可勝。特別是迷信給出的獲勝勝率,話說這個勝率數據真的完全可靠,第四盤怎麼贏的?神之一手之後,狗竟然好幾步之後才勝率驟降,足見其中的缺陷。


孫子兵法雲「知己知彼,百戰不殆」。作為人類,我們先來偵查一下AlphaGo團隊的虛實。除了大老闆Hassabis在twitter發話,樊麾和Aja黃也在Facebook上透露了一點信息:

「我們很高興向大家宣佈,AlphaGo的棋力在已過半年有巨大的進步,將在2017年初復出下棋。我們團隊會在近期內公布更多訊息。

We are happy to announce that AlphaGo is stronger than 6 months ago and will play again early 2017. More details coming soon.」

看來,AlphaGo這段閉關,神功應該更精進。Google公司文化比較低調的,說「巨大進步」,應該是至少提高一個子以上。這已經給人類選手帶來了很大的壓力。

而此外,中國國產AI(例如最近的」中華土狗「等),還有Zen和CrazyStone,已經先後具有和業餘強豪和職業棋手較勁的實力。機器洪流滾滾而來,作為人類中圍棋職業棋士和愛好群體,難道要俯首稱臣?

當前的技術背景是,機器深度學習的發展使得計算機在圖像識別,語音識別等領域逐漸超過人類。在原本很多很模糊的領域,機器正在超越人類的視覺和用於識別的神經中樞。

但是,圍棋除了其模糊性之外(大局觀等),計算仍然是第一要素(另外一個是判斷)。「多算勝,少算不勝「!圍棋千變萬化(10^172),AI並不能窮盡變化。而目前的進展,只是AI在模糊地帶對於圍棋的領悟比大部分人類棋手更加深入。在邊角封閉區域,目前計算機演算法是可以做到基本能窮盡有利變化,找出正解。但是在半開放區域,連環劫(不知道這次AlphaGo解決了沒有)方面,機器思維缺乏人類的靈性方面,就會暴露出來。

機器的大局模糊判斷比人類更接近正解,這類似蒙特卡洛求PI,通過隨機在1x1的方形區域隨機扔點,計算落在單位圓中的點數比例來推算PI的近似值,也遠超過一般人的精度。但是如果回到圍棋的接觸戰,在棋子交錯中,不容模糊,每一個點的概率也很低,機器就容易出現誤算了,因為這裡要死算,窮舉不同序列。雖然,在我們看到的AlphaGo左右互搏,它的直線計算能到很深的程度,但是如果直線多一些分枝,以目前的科技水平,AlphaGo也很難有能力算清,並駕馭局面。李世石的神之一手也就是出現在這種情況。

(看了一些其他意見,說明一下「計算」。有棋友把什麼都歸納為計算。日本人以前圍棋書上經常提到的「細算」,說的就是這種一個圖形一個圖形一步一步的推演。這比較接近本文提到的「計算」。它不是通過一些類似圖像處理的高斯模糊之類的統計計算方式,而AlphaGo的價值網路,正是採用類似這種使用計算統計規律而不是逐步細算。AlphaGo和大部分AI在使用模糊計算方面確實出眾,這跟計算機在圖像/語音識別方面是一致的。但是圍棋特有的細算,和這種模糊計算的形式是有很大區別。簡單的例子,就像人識別眼前的東西,跟算術計算肯定是不同的「計算」。因此,都歸結為「計算」跟說都歸結於原子分子等運動,都不夠細緻。

AlphaGo也有「細算」的模塊,就是採用蒙特卡洛隨機走子,然後通過統計來判斷走子的價值。它沒有窮舉,因此省了時間,但是這也是AlphaGo無法成為圍棋之神的原因。)

在和CrazyStone和Zen的實驗中,我發現重視中腹和積極作戰,往往是能提高勝率,克敵制勝。因此,武宮正樹首推的宇宙流,將兵力集中在中腹,在開放的局面和AI進行計算上的較量,也許是人類的一條取勝之道。當然,AlphaGo這種級別的AI,對人類頂尖高手的要求也很高,算路不達到50步以上,勝機也渺茫。

Deep Zen在KGS已經排名第一,據說在快棋擊敗了世界冠軍級的人物,而確切讓兩子勝了北美職業。雖然它和AlpahGo還有差距,但是基本接近了擊敗李世石的AlphaGo版本。Deep Zen 19日開始對趙治勳的三番棋,是一場前哨戰(屆時弈客圍棋和圍棋之眼都會有直播),如果趙治勳能夠取勝,將極大提高人類棋手對抗AlphaGo壓迫階級的信心 :D 希望趙治勳老師能至少找出一些方法,輸了也要帶給人一些希望,切忌鋪地板。

圍棋的死活能力,是在AlphaGo推動下,人類棋手最需要提高的一個方向!下一個偉大的棋手,大膽預測還是屬於人類,是范西屏/黃龍士/施襄夏/吳清源的合體 :D

按照慣例,附圖來自圍棋之眼(http://goeye-app.com)


我覺得,以AlphaGo目前的棋力,戰勝AlphaGo的一種可能性是,AlphaGo大量公開自己對弈的棋譜供他人研究,根據以往的經驗,一個棋手大量棋譜公布後,之後的勝率往往會出現下降。大量圍棋高手來研究AlphaGo的棋譜,有可能很快就找到AlphaGo的BUG,例如AlphaGo和李世石的第四盤棋就出現了極為明顯的失誤。

此外,我覺得打AlphaGo應該組個10人團隊來打,人類下圍棋最大的弱點就是會犯錯,組團後,通過集體力量,犯錯的幾率會大為減少,只要不犯錯,戰勝AlphaGo並不是沒有可能的。例如1933年吳清源和本因坊秀哉的那盤棋,足足下了三個月,前後打掛(暫停)幾十次,每次都是秀哉打掛,秀哉打掛一回家,他的家裡坐滿了他的弟子,各個都是職業棋士,然後大家就開始研究如何應對吳清源的棋,比賽一直到一大半的時候,吳清源都佔據明顯優勢,但是最終秀哉的弟子前田陳爾五段發現了第160手的妙手,幫助秀哉挽回了劣勢,最終吳清源以2目惜敗。集體的力量,讓棋力明顯不如吳清源的秀哉等人戰勝了吳清源。


我就說歷史事實,

1.人類排名第一的棋手並沒有輸給過電腦。

2.即便是人類排名第一的棋手輸給了電腦,他也會繼續在人類中排名第一。

3.電腦的棋力直接來自於deepmind項目程序員的智慧,並不是所謂的神經網路。我們可以看到,擁有價值網路和策略網路的deep zen go第一局就輸給了60歲的趙治勳。很顯然,這是因為zen團隊的補丁打得不夠。所以,電腦棋力的關鍵還在於補丁的質量,facebook的圍棋AI棋力就非常有限。用補丁而非什麼神經網路來揭示電腦的棋力來源,是否拆穿了些許電腦強大的神秘的面紗呢?

4.只有把alphago全面下放,使其得到大部分棋手的全面測試,那麼,由此得出的alphago的水平才是真實的。zen6已經從最初的強大,什麼5s zen上9d之類的神話,走到了今天被廣大有一定水平的棋友花式戲耍的地步,其原因就是棋路被參透,bug被發掘。alphago若下放出來也一定是同樣的結局,程度上,可能有區別,但方向上,不會有差異。

alphago在2017年復出是好事。有幾大看點。

首要看點,柯潔帶不帶人?我認為他應該帶,帶兩個幫手,至少可以分攤壓力,使氣氛不會太壓抑。

其次,要看中國棋院的集體智商。柯潔這次對陣的雖然是更強的alphago,但他的準備要比李世石充分得多。中國棋院必須要成立集體研究團隊,進行緊鑼密鼓的備戰和針對性的訓練。國產ai及其技術人員可提供訓練支持。

最後,心態。輸了不可怕,該怎樣還怎樣。萬一贏了呢?

ps

升降級、讓子之類的就免了。alphago並沒有贏過人類最強的棋手,對陣李世石也因為實力不濟而輸了一盤。不知為什麼很多阿法狗的粉絲都選擇性忽視alphago的敗局,或者把實力不濟歸結為bug。


不知道這次比賽會怎麼樣,Aja Huang說已經解決了與李世石第四局比賽中78神之一挖的問題,原因是數據不夠,再回退到78手時,現在的AlphaGo給出了正確的應對。。。computer go論壇上有人猜測還是通過更多的數據訓練,解決了這個問題。。。


看到有人說通過限制Alpha GO的思考時間可以幫助人類贏棋,我想google的應對策略是:並行計算再加50台機器2333


現有的公開棋賽,,允許 人工智慧參賽,就行了。

Alphago也不用裝神秘,網上對弈平台那麼多,有種別搞什麼宣布復出,大大方方上網註冊帳號練級呀!有種來呀!


在我看來,短時間內只有悔棋模式可以試試!團戰缺乏組合挑選以及實戰訓練還不如單兵,升降壓力逐漸加大,後期棋手會崩潰技術變形!

以上玩笑部分請勿當真;


昨天上課,給學生講在家如何練棋,學生問我用天頂可行不?我都愣了。反應了幾秒才知道他要用Zen6來分析自己下的棋,我想說這才是我們關注人工智慧的點,什麼時候能普及


人類棋手機會不大。拿著現在最新鮮的研究成果去試試吧,也只能這樣了。


1.對局時間要充分,起碼得有應氏杯的時間,人類可以要求打掛2~3次。

2.人類可以配兩個助手,比如古力、唐胖協助。


阿法狗的比賽太少了,如果多些說不定可以找到破綻。


圍棋白痴裝逼強答,阿狗仍然是基於統計和進化演算法的,尤其其演算法的進化是基於大量對弈過程,而這些過程仍然是全人類提供的,故而仍有可能擊敗阿狗。

假設有若干個和地球相似的行星,其上都有和地球上相同數量的圍棋人口,互相不通訊往來,每個星球都知道圍棋規則,但圍棋的風格文化均獨立發展,當歷史積澱和地球相當時,各派遣一名頂尖高手代表星球來地球與阿狗對戰,將有一定可能打敗阿狗,其中棋風與地球差異越大者,勝利的(和慘敗的)機會越大。結果符合正態分布,但隨著對弈次數越多,勝率越低。

如果阿狗是基於數學證明的機器,圍棋就沒有意義了,圍棋雖然是複雜博弈,但不是非確定性的,定然存在某方必勝之策略(空間)集合,在此語境下所有類似博弈都無意義,均會以某方直接投降(先手必敗)和某方走出特定一步之後對方投降(先手必勝)結束。

圍棋高手當前要想戰勝阿狗,不如改為和它打麻將。


我曾經和家族內長輩在年輕時省象棋冠軍搏殺,一盤之後意識到水平完全不在一個維度,於是打開手機,和長輩說我要和一個很重要的朋友聊天,我們邊聊邊下。但是打開象棋軟體,人機,大師級。然後和長輩,你先走吧。然後在手機先下電腦的路數,看電腦的應對,和長輩下。

從那之後,家族裡流傳著這樣一個傳說,老三家的孩子和xx下棋,一邊玩手機一邊下的,贏了。看看人家裡的孩子一個比一個聰明。


  • 個人觀點,現在一線棋手境界都達不到分先和阿老師下的水平,換句話說現在一線棋手的棋都是研究怎麼和人爭勝負的,可以嘗試讓李昌鎬和阿狗下不限時的棋,這樣似乎更能說明問題。怎麼說呢,不是不尊重李世乭,我還是覺得李世乭的棋里包含太多的對人的研究。比如我看不清的你肯定也看不清,裝作慌忙的樣子下個誘招什麼的。。。單純棋的境界,李昌鎬要高明很多。
  • ——————————————
  • 阿爾法失誤率肯定比人類低,這是無疑的。可是大局觀真的比人類強么?巔峰時期擁有超強大局觀和極度精確判斷力的李昌鎬真的不足以與阿爾法爭勝負么?

棋類比賽 無非就是算數據。。。所以無論如何 在未來人類都敵不過計算機的。


感覺還是很有機會的,所謂的手筋alphago很難下出來吧,從年初的大戰感覺人類的時間是最大問題,總感覺李世石時間不夠用,然而alphago完全不面臨這方面問題


推薦閱讀:

如何看待柯潔說看不懂 AlphaGo 的自戰棋譜?
如何評價2017年1月4日聶衛平親自披掛上陣對陣Master最終以7目半告負之局?
用什麼策略可以戰勝 AlphaGo?
從圍棋角度看李世石與 AlphaGo 的第二局比賽有哪些關鍵之處?
類似 AlphaGo 的人工智慧在遊戲王、萬智牌等卡牌遊戲中勝率如何?

TAG:圍棋 | AlphaGo | 人機對戰 |