如果李世石執黑,仿效吳清源對木谷實的那盤棋,第一手天元然後開始下模仿棋,AlphaGo能否應對?

附加問題:如果用白棋後手模仿棋呢?


謝邀,因為邀請回答圍棋類的問題實在太多了,而且本人寫的又臭又長,可能無法一一回答,還望見諒。

在開始這個話題之前,我們需要先普及一點圍棋的規則,那就是吳清源和他之前的時代是沒有貼目的(當然,在吳的時代已經出現了雛形,但是受到的非議很大,所以正式對局一般不用,正式開始使用應該是20世紀後半段的事情了),因為黑棋的先行效率很大,所以被認為是佔了很大便宜的,這個貼目其實就是為了平衡局面而做出的手段。那麼先手的優勢有多大?以前是貼四目半,後來變成了五目半,一直到現在,日韓六目半,中國貼七目半。

那麼大家就會問,在吳清源的時代,沒有貼目,那黑棋豈不是優勢上天了?沒錯,所以是下手才拿黑棋(也就是對局雙方棋力弱的人),時至今日,棋盤上還有上手位置跟下手位置的區別,一般對局時比較謙虛的晚輩會主動先到場坐下手位(這點在圍棋文化傳統最好的日本尤為明顯)。

那麼如果大家棋分一樣(也就是身份),那麼就分先下,你一盤黑棋,我一盤黑棋,誰也不佔誰便宜,而十番棋里你被對方降格了,那麼就變成了下手,也就是沒有資格和對方分先了,所以吳清源把所有前後三個時代的圍棋高手全部降級了,沒有人有資格和他平起平坐,這也是日本媒體說:昭和棋聖能讓全天下一個先手的原因。至今想想,依舊讓人心馳神往。

那麼回到這個話題上來,因為貼目的出現,所以執黑先手天元就和模仿棋成了最大的矛盾,因為模仿棋會出現一種什麼樣的局面呢?那就是雙方的局勢一樣。這對黑棋是不利的,因為黑棋要貼七目半,所以一旦出現先手天元模仿棋的局面,代表白棋如今大可以一路下到終局不需要思考破局的辦法,反正貼目的是你不是我,這是黑棋無法接受的,所以這兩個詞很難同時成立。要麼就是黑棋先手天元,要麼是執白後手模仿棋,讓黑棋去思考破局。

我們先說說先手天元。

天元在圍棋的棋盤上是最為特殊的一個點,關於圍棋的起源有人說是算數,有人說是占卜,不管是哪個,天元都是棋盤上最獨一無二的,他沒有對稱點,他在最中心,所以一直以來,天元在哲學上都有著超凡入聖的意義,不管是中日的歷史上,都有皇帝以此為年號,可見一斑。

那麼如此王霸來朝的一個點,為什麼罕有人用?

因為他是很難發揮出威力的一個子。我們下圍棋有金角銀邊草肚皮的說法,這是為什麼?因為越是靠近邊角,棋盤的自然邊界會幫你圍子,也就是說,圍出同樣的目數,邊角需要的子越少。而中間的大模樣不僅很難圍,而且處於四戰之地,對手要打入掏空你也相對容易,所以歷來圍大模樣獲勝的名局多就在於此,因為他的確不易(在這裡說句題外話,一般走上圍中腹這種不歸路的除了武宮正樹這樣的偏執狂都是逼出來)

那麼子效如此低的一個點,自然就罕有人用,畢竟大家是來爭輸贏的,不是來談哲學的。日本圍棋正式對局裡第一次出現天元的是澀川春海下出的,當時他的對手是本因坊道策,大概有點懂棋的朋友一聽這個名字就知道澀川春海要悲劇了,事實也是如此,作為大家公認的圍棋神童,獨創出自己的一套圍棋哲學,圍繞著天元打造的體系,在戰前,他揚言,如果這盤輸了,那麼他終生不會再第一子落天元,於是戰後他實踐了自己的諾言,後來幾度挑戰無果後引退棋界,成為了幕府的天文官,制定了日本的第一部曆法,至今關於講述他本人波瀾壯闊一生的有部電影叫《天地明察》,有興趣的朋友可以去看看(註:豆瓣描述里寫的是安井算哲,這是他父親給他起的名字,他父親也叫安井算哲,這真是很繞的一件事情),他也在另一個領域成為了家喻戶曉的人物這裡暫且不提。

在澀川春海之後的兩百多年,又有一位先手天元的棋手出現,當然了,這盤棋跟上面不同,因為棋手黑田挑戰當時的方圓社社長几連敗而被人嘲笑,所以那一局憤怒的黑田直接把第一手拍在天元上,顯示自己不佔方圓社長便宜而決一死戰的決心,可惜他不是漫畫小說的主角,沒有意料之中的爆種,反而大敗虧輸。

從以上兩個例子,你可以看出先手天元的某些特質,大凡敢下這一手的不是亂世梟雄就是亡命之徒。

進入了20世紀,第三個在公開對局裡先手天元的人出現了,當時他的年齡只有15歲,當然了,得益於現在吳清源先生的成就,我們可以總結出一套溢美之詞,比如從小我就看出他骨骼清奇,這個先手天元一看就是要改變時代啊,歷史的車輪開始轉動云云,但是在當時,這毫無疑問的就是一個熊孩子的惡作劇,特別是這不僅是先手天元,還是模仿棋。

模仿棋的歷史由來已久,已經不可考了,別說是職業棋手,我相信每個剛學棋的少年都下過,未必是從別處看到的,因為模仿棋這簡直就像是一種初學者的本能,所以在正式對局裡,他很長一段時間被認為是不道德的。

這句話如何理解?模仿棋最大的特點就是模仿,先手在那裡苦思冥想,當他花個幾十分鐘想完的招數,你五秒鐘就搞定了,所以從道德的角度來說,在當時棋風森嚴的時代被噴是自然。但是與此同時,他也是把雙刃劍,因為模仿不僅僅是單純的模仿,當行棋到了一定的步數,你什麼時候脫出,停止模仿,抓住棋盤上的勝機,這是十分考驗後者的一件事情,這種遊走在鋼絲繩上的刺激,簡直如紅酒般的醇美。所以在吳清源後,模仿棋曾經大行於世很長時間,但是在當時,用他老師賴越憲作的話來說:幸好那盤棋輸了。

也許你已經看出了模仿棋最大的優點:沒錯,就是時間。我覺得時間對於棋手和阿爾法的作用是相互的,同樣的時間,我們也許算的不夠阿爾法深,所以,如何減少對方的時間,同時增加自己的時間,這是很重要的一件事情,特別是在初盤的階段。那麼在這種情況下,模仿棋未必不是一種選擇。

但是同樣的,這就回到那個話題,要棋手放下某些顧忌同樣是一件不容易的事情,特別是李世石萬一真的選擇了這個做法,不管輸贏,可以想像賽後他會面臨多大的輿論壓力,當然,這僅僅是一種選擇,即使李世石已經不在巔峰,我相信這個星球上有資格比他說更懂棋的也不會太多,讓我們拭目以待。


吳清源對木谷實那盤是執黑不貼目的。題主已經認為AlphaGo能讓小李一先了嗎?可惜小李不可能會答應被讓先的。


網上搜了一下,李世石在大賽中三次祭出模仿棋,包括:

去年12月22日,第36屆韓國名人戰第四局,對戰姜東潤九段。

2014年11月22日,金立智能手機杯全國圍甲聯賽第21輪,李世石對黨毅飛。

2008年亞洲杯李世石對戰趙乘。

三局他都贏了。

今年2月2日,有人在Yigo論壇上和aja huang(黃士傑,AlphaGo論文的並列第一作者,台灣師大的博士)提到此事,請他留意。huang表示:謝謝你的提醒。

我估計在訓練AG時,走過模仿棋的嘗試。


我前幾天與ZEN對弈特地執黑下了幾十盤模仿棋,發現幾乎每局都不重樣。但具體在什麼時間點停止模仿,以及有哪些致勝戰略上,我覺得仍然是一個難題。大體上是等白棋產生一個低價值的後手棋後,迅速判斷黑棋的先手價值;以及如果中央的天元與盤面上的黑子形成了很好地中腹配合之後,是一個有利的變盤時機!

以下是兩個參考圖


我對深度學習是外行,對下棋也是外行,但一些了解還是有的,我就談談我的看法,大家參考參考。

要知道阿法狗能否應對,必須知道阿法狗的計算模式。我們知道神經網路是從結構上模擬人類大腦的,但它和人腦還存在區別,我們需要通過比較來看清兩者的不同。

人腦有兩種計算模式,一種是串列的邏輯思維,另一種是並行的非邏輯思維。前者就是我們一步步邊想還邊有個聲音在說話的模式。這種思考我們知道整個過程是怎麼發生的,一步步很清晰,有跡可循,而後者我們是不知道整個過程是怎麼發生的。比如我們看見一個美女,我們一秒鐘就得到一個結論----這個人好漂亮啊。我們知道整個計算過程是怎樣的嗎?不知道。整個過程是並行計算的,速度很快,但我們對過程一無所知,是個黑盒子,我們只是得到了它計算的結果而已。那麼現在的問題是,神經網路從結構上模擬人類的大腦,並行計算顯然是可以的,這個我們都知道,但它有實現串列計算嗎?

我對深度學習是外行,就我所了解的,並沒有實現,如果有內行的說已經實現了,歡迎給大家科普,讓大家看看是怎麼實現的。當然,實現肯定是可以實現的,畢竟人腦就是一個活生生的例子嘛,但怎麼才能實現這是需要研究的,阿法狗已經實現了嗎,這是一個問題。串列可以模擬並行,這個我們已經知道方法了,並行也可以模擬串列,但方法怎樣這個還要研究。

我們在下圍棋的時候,這種串列和並行的運算都是存在的,我們對大勢的判斷,對應該選擇哪個點位或者區域落子,靈機一動中意的某個點位,這都是並行計算的結果,我們說不清楚是怎麼得到的。而對選中某個點位後會有怎樣的發展,又是通過一步步的推演來預判的,是串列的計算,整個計算過程是清晰的。所以說我們在下棋的時候是同時具有並行和串列兩種計算的。

如果阿法狗是一個純粹的神經網路,那麼有可能它已經同時實現了並行和串列的運算,即使和人類不是一樣的起碼也是相似的,我們就當它和人類一樣吧,那麼我們就可以把阿法狗當人看了,我們對自身的了解也可以套用在阿法狗身上。那麼我們人類可以判斷對方在下模仿棋,並因此思考對策破局,甚至設套。我對圍棋是外行,不懂內行是怎麼應對的,反正人類能想到的應對阿法狗應該也能應對,何況阿法狗學了不知幾萬種棋局,這種棋應該也見過,人學了幾萬種棋局後能做的應對阿法狗應該也能做到。

如果阿法狗並沒有實現串列運算,那麼說明它的判斷模式和人類是有差別的,它對這幾萬種棋局的利用和人對這幾萬種棋局的利用是不同,那麼它面對這種局面能否做出像人類一樣的應對就值得懷疑的,說不定最後只能平局收場,這是完全有可能的。

如果阿法狗不是一個單純的神經網路,那麼它可以通過程序模擬人類的串列計算,發現這種情況用並行無法解決就調用專門設計的程序來專門解決這個問題,即使程序員以前沒有發現這個問題,現在知道阿法狗的並行計算對這種情況無能為力後,也可以連夜編寫代碼,專門設計一個程序,當出現這種情況就調用這個程序,但這種程序就完全依賴於人來解決問題了。



單純的模仿棋是很容易被設套絞殺的,而適時停止模仿選擇利於自己的走法之後未必下得過alphago。更何況還有貼目的壓力。


貼目規則直接廢掉這種情況。吳先手天元然後下模仿棋是在沒有貼目的情況下。


不懂圍棋,想起看過&<棋魂&>中有個小孩去對決塔失亮,開始下天元,然後下模仿棋,最後被發現kill的,


模仿棋有毛用。如果李世石第一手下天元,然後模仿,頂多能在開局省一點時間而已。一旦戰鬥發展到中腹就 沒法模仿了。從這幾局進程來看,小李多一兩個小時思考時間實在無法改變大局。

而且,我覺得,從阿爾法狗的棋風來看,如果起手天元,會更早帶動中腹戰鬥。阿爾法狗或許會在角上簡單定型以後直接飛掛天元,模仿也就無法繼續了


推薦閱讀:

AlphaGo 準備在2017年初復出,據稱比16年3月的版本強很多,人類棋手該如何準備與之對弈?
如何看待柯潔說看不懂 AlphaGo 的自戰棋譜?
如何評價2017年1月4日聶衛平親自披掛上陣對陣Master最終以7目半告負之局?
用什麼策略可以戰勝 AlphaGo?
從圍棋角度看李世石與 AlphaGo 的第二局比賽有哪些關鍵之處?

TAG:人工智慧 | 圍棋 | 深度學習DeepLearning | AlphaGo |