試論解決一個重要的圍棋問題 -- 先行貼目多少才算公平?
AlphaGo挑戰李世石結束,就明顯感覺到這個熱點關注度直線下降,一個圍棋AI吸引了那麼多目光,也是夠了,功不可沒。其實歐美對此事沒有我們中日韓這麼關注,也說明推廣圍棋依然任重道遠。
我在最近十幾天由於AlphaGo表現帶來的刺激,各種腦力激蕩,由此想到如何解決圍棋公平貼目數的問題。
其實早已有人也想到了用計算機圍棋技術來解決這個問題。作者首先在3月16日大戰結束後提出一種設想 -- 建議修改圍棋的勝負規則
作者關鍵觀點如下:
圍棋的貼目問題是這個集邏輯和計算與一身的頂級智力遊戲的要命短板。貼目規則完全是經驗性的,沒有辦法去證明並保證任何貼目規則的公平性,也無法知道在理論上還是在數值上是否有可能獲得的公平的貼目數,雖然使用兩個相同的計算機隨機模擬可能值得一試。
後來作者在3月17日的另一篇博文補充說到 圍棋的公平貼目數在實踐上其實不存在
我在看到作者這個說法之前,已經通過思考得出自己的看法,其實我們並不要非常公平的貼目數,因為這樣會嚴重破壞圍棋對弈的趣味性。本文後面會展開我這一觀點。
作者文章中為了解決公平問題,建議這樣來修改比賽規則:
在此,我想出了這個建議來修復這個bug。我的建議很簡單,就是徹底清除這種補償規則。然後,每場比賽將包括兩盤棋,或兩個半場,每個棋手執黑一盤。比賽的最終比分將根據從兩盤棋中獲得的總子數計算。如果一名棋手中盤認輸,那麼整個棋盤子數將歸屬於另一方。兩名棋手之間的競賽可以有一個奇數倍的場數。
其實這種建議是可操作性是很低的,即便能這樣操作,弊大於利。作者在文中也說:
該提議將在邏輯和數學上帶來完全的公平,一個有益的副作用是新規則不鼓勵中盤認輸,尤其是在第一盤棋。因此,鼓勵每一個棋手戰鬥到最後,無論情形如何落後。
我認為弊大於利,其實遠不是上面的原因這麼簡單,因為這種規則同樣會嚴重破壞圍棋對弈的趣味性。我所指的趣味性包括職業棋手之間和業餘愛好者之間的對弈趣味性,還有觀看這些對弈的趣味性。
如果僅從可操作性來說,這種規則會嚴重損害舉辦方和贊助商的利益,其實最終也是影響圍棋觀眾的利益。
作為30年棋齡的圍棋愛好者,我深深地記得當年中日圍棋擂台賽的直播。由於圍棋比賽本身的特點,圍棋比賽的直播和其他體育節目的直播是很不一樣的,以往的比賽用時比較長,除了關鍵場次想要全程直播加解說是不太現實的。
圍棋比賽時間長,第三屆擂台賽劉小光對日本老將石井邦生,兩人這局棋共耗時8小時36分,曾創下擂台賽用時最長紀錄。實際上,這麼多年來圍棋比賽的發展,比賽用時是趨向縮短的,為的就是變得更適合電視直播。
作為電視直播方來說,需要比賽激烈緊湊,場外評說精彩,8個小時的直播和場外評說是難以想像的。作為狂熱棋迷的我,也要反對廣泛採用長時間的直播,注意我用了廣泛二字,為了自身利益,我也是希望直播緊湊,可以吸引更多的人學會下圍棋愛上下圍棋。
如果按照作者的建議修改規則,我可以想像到比賽節奏變得更慢,增加了舉辦方的負擔而並未增加比賽的趣味性。
圍棋對弈和觀看的趣味性來自什麼呢?我不想一一列舉,只想說勝負的不確定性是一個很重要的因素,這個不確定性受到很多因素的影響,棋手的實力、棋風、對弈者的狀態、貼目數、執黑還是執白、場地、外界壓力,甚至還有盤外招。正是這些,特別是讓我們這些觀看者總是充滿了好奇、期待、猜測、分析,樂趣無窮。
如果有一天AlphaGo已經遠遠超越人類棋手,狗狗分先必勝的時候,我們看狗狗比賽恐怕就只能抱著學習的態度,但是趣味性大減。
棋手之間的對弈趣味性卻不會因為AlphaGo的存在變得無趣,相反,我們總是會不斷想辦法讓比賽變得更有趣味。即便是業餘棋手之間的對弈,也有天弈圍棋規則 這種嘗試,在我看來,公平無需由精密的規則來保證,而這種嘗試帶來的趣味性倒是我所看重的。
為什麼我認為我們並不需要非常公平的貼目數呢?
比如說,李世石和古力有很長一段時間的對抗,只要他們兩人之間對弈的次數夠多,雙方執黑執白的可能性總是趨向一致的,這就是公平,沒有必要強調貼目是否絕對公平,也沒有必要強調採用哪個國家的圍棋規則,採用不同的規則其實也是帶來了一些變化、不確定性和趣味。從這個角度看,就可以理解圍棋規則的統一有利於在世界範圍內推廣,但是對於中日韓棋手來說並非最迫切需要的,動力不足。如果大家都覺得到了不統一規則將嚴重影響圍棋影響力,最終影響到棋手的利益的時候,規則統一就容易辦了。
作者在3月17日的另一篇博文圍棋的公平貼目數在實踐上其實不存在 提到
從日本貼目規則的發展歷史來看,貼目數逐漸增加的過程也與圍棋水平提高的進程相吻合。
我覺得沒有任何證據說明貼目數的增加和圍棋水平提高之間的關係。不過這不是博文的關鍵觀點。作者在上面那句話後緊接著說:
這樣看的話,公平的貼目數是隨對弈棋手的水平而變化的,因此在數學上也就不存在一個唯一解,即未知公平貼目數X(d1,d2)是一個雙方棋手水平例如段位的函數。
更進一步看,即便在數名水平相當的棋手之間,由於個人風格不同,他們兩兩之間的貼目數也都會有略微變化,X(d1,d2)進而要修改為X(p1,p2)是兩名具體棋手的函數,即兩名具體棋手要進行成千上萬的棋局博弈,再對結果進行統計平均得到公平貼目數。換言之,在數學上公平貼目數是隨任何兩名具體棋手變化而變化的。......用一個簡單而嚴謹的勝負規則取代目前含糊的貼目規則應該·不是什麼壞事。
其實基於我自己的思考,作為愛好者而非研究人員,我已經沒有太大興趣研究公平的貼目數是否隨對弈棋手的水平而變化,也沒有興趣研究在數學上公平貼目數是隨任何兩名具體棋手變化而變化的是否成立。因為,我的觀點是,作為任何一個活躍的職業棋手,在充分參與各種比賽的情況下,例如ELO等級分制度已經得到大多數人的認可,相當公平,沒有必要追求絕對的公平而破壞棋類比賽的趣味性,趣味性是生存發展的關鍵,不管是棋類、球類還是冒險。
無法知道在理論上還是在數值上是否有可能獲得的公平的貼目數,雖然使用兩個相同的計算機隨機模擬可能值得一試。
其實對於作者第一篇博文中提到的上面這個看法,我認為數學理論上應該是可以證明能夠獲得公平貼目數的,採用計算機隨機模擬,也就是蒙特卡洛方法應該是可以解決的,不用擔心公平貼目數隨著對弈棋手的水平而變化,因為我們應該可以證明隨機模擬和AlphaGo無限接近神之一手都可以得出所謂的公平貼目數,只要兩個計算機圍棋AI的水平保證一致,並對弈次數足夠多,至少在100萬盤,這個數量對於蒙特卡洛方法來說輕而易舉,並不耗費太長時間。
終,轉載需聯繫本人
後記
各位有興趣的可以想想圍棋的貼目數如果為整數,就會經常有和局,對比賽來說是否好好處?
勝負雖然和貼目數有很大關係,不過其實同一個棋手在執黑和執白時的心態是不一樣的,即便我們找出了公平貼目數,由此心態帶來的影響是不可忽略的。如我,我是尤其喜歡白子,喜歡後發,也喜歡白色,總之,執白時我心裡會比較舒暢。有些棋手據說也是擅長執白,或者擅長執黑。
推薦閱讀:
※DeepZenGo的最後震撼,退役但不說再見
※探索圍棋官子最優解(二):組合博弈論
※今天龍星沒有解說,所以整理一下最近的日本棋壇新聞
※「神之一手」背後的變化
※有間學堂丨以棋益智,以棋育人——掀開應昌期圍棋學校的神秘面紗