對棋手來說,AlphaGo 有沒有對訓練和圍棋知識結構產生影響?有哪些?
進入圓桌 ? 人機對弈終章,參與更多相關討論。
阿爾法狗的出現,讓我們發現圍棋原來還有那麼多的未知!它開拓了我們在前半盤的視野,引領我們進入更未知的領域去挖掘圍棋的奧妙!在未來,雖然還不是很清楚圍棋AI能發展到什麼地步,但我感覺,圍棋AI與人的合作是必然的趨勢!圍棋AI ,將成為人們日常圍棋訓練中的輔助工具。但它到底能帶給我們多大的幫助?下面我把我的想法與大家一起分享一下,我們就從最近在棋盤上最流行的開局點三三說起:
圖1:在阿爾法狗出現之前,人類職業比賽史上,是沒有人那麼早就去點三三的,理由是什麼?很簡單,以往人們黑1點三三後都是下到白12才告一段落,黑棋占的小角只有10目的確定地,而白棋的外勢則輻射整個全局,雖然一下子還沒有看到具體的實惠,但其潛在價值是不可估量的!如果黑角好比100萬現金,那白棋這道外勢就好比100萬股優質股票,雖然手上沒有確實的現金,但你能說它沒有價值嗎?它的價值是不可估量的!
圖2:那為什麼阿爾法狗明知道這個下法是虧的,它還去下呢?它可不會輕易做吃虧的事情,它之所以這麼下,是因為它在一個小小的細節上做了創新:那就是:它把黑1,3與白2,4這兩下交換給省略了!千萬別小看省略這兩個交換的意義,正因為這兩個交換的省略,使得開局點三三得以成立......
圖3:其背後的邏輯是:由於圖2中兩下交換的省略,白棋的外勢頓時沒那麼厚了。如果圖1中的外勢是100萬股優質股票,那現在的外勢就變成了100萬股普通股票了,它的估值潛力一下子就差遠了!而且,黑1,5之後,白右下這層外勢由於沒有根據地,從而很有可能在將來被黑棋攻擊而變成負麵價值!
阿爾法狗下出點三三後,很多人會想:「阿老師點三三肯定沒毛病,那我們也去點吧」!結果由於你沒有明白阿老師為什麼要去點三三(因為它省略了兩個交換而改變了白棋厚勢的潛在價值),結果你很可能在實踐中不會靈活運用,從而經不起實戰的考驗。所以,在未來,圍棋AI會給人們帶來越來越多更正確的信息量,但是,如何去理解和吸收這些信息量,並將其轉化為自己所用(要理解為什麼可以點三三背後的因果邏輯,而不是盲目去模仿)?將成為未來人們在圍棋學習和訓練上的新課題。未來,人們對信息的理解,分析以及吸收的能力,將變得越來越重要。
我年輕的時候下黑白棋,也自己寫過黑白棋的AI。
黑白棋的今天就是圍棋的明天。
你看黑白棋現在的狀態,幾條均勢的線和比較好的變化已經被摸透了,想成為頂尖高手少不得背draw line,不過真正中盤的較量,人類對人類,還是有很多可玩的,如何把對手拐到自己熟悉的變化,是取勝的關鍵。對AI的運用上,可以用機器做復盤,也可以藉助機器來訓練尾局計算能力。
此外,為了避免背譜過多,現在也發展出前幾步隨機的黑白棋規則,反正即使是黑白棋這麼少的變化,機器打敗人類已經接近30年的棋種,也沒有出現你們擔心的那種所謂失去樂趣的情況。
現在的阿狗還沒有實現民用化,一旦將來它能夠運行在較小的集群上,圍棋運動整個水平一定會變得完全不一樣,新人利用自己熟悉的變化打敗高手也會變得更普遍,直觀來說,就是圍棋會出現更多不確定性,從競技的角度,這反而會增加樂趣。所以,我對整個的局勢還是持比較樂觀的態度的。
也許不久以後想參加圍棋比賽得先學Python C++
狗開闢了圍棋自身定量化和系統化理論的一個可行性研究方向。而這個領域傳統研究有限(僅道策和李昌鎬略有貢獻)。下面以絮征的例子說明。
5月23日柯狗三番棋第一局和5月26日人狗聯棋都在序盤階段出現了絮征的局面。
柯狗第一局,狗的白棋第24手下在O9的位置上。
人狗聯棋,狗第23手下在H6的位置上。
第一個圖的局面下,其實存在4、50個絮征的選點,但是狗選擇I點,應該是狗自身海量對局之下價值網路判斷的自然表達。
遺憾的是,而對4、50個絮徵選點的價值判斷,從古至今人類從未有過。大部分局面之下,人類停留在A點(基於「不給對方借用,一手走乾淨」這種樸素的思想)。
考慮到征子是非常普遍的局面,圍棋已有千年歷史,而人類自身經驗積累對於征子的判斷還停留在4、50種可能性中的1點,所以柯潔說:圍棋道100,他只了解2,狗就是100,就是上帝,這是毫不謙虛的客觀表達。
非常希望谷哥能夠公開狗的自身對局(僅其自身對局數量已經遠超古往今來人類對局總和),打開棋道探索真正的大門。
回到題主問題:狗之前,圍棋沒有知識體系和研究方法。狗之後,圍棋才有知識體系和研究方法。
以上。
圍棋門外漢。
然而,之前有報道,alphaGo Master通過自我對局的訓練,實力達到足以讓alphaGo Lee三子。
許多朋友認為這是一種假象,源於AI在「左右互搏」中的「過度擬合」(overfitting)效應。
現在看來,恰恰相反,其實是人類在各種人類「手談」中「過擬合」了:
局限於既有之人類圍棋定式,從而驚訝於「人機對戰」中AI的「新招迭出」,不知所措。
換言之,對於人類比賽中的各種定式,AI了如指掌;而對於AI的定式,人類尚未進行探索。
因此,AI目前知己知彼,人類目前知己不知彼。
假如,人類棋手能夠向AI學習,拓寬思路,走出"人類現有圍棋定式"的舒適區。
那麼,在三尺棋枰之上,人類與AI的抗衡,未必沒有懸念。
p.s. 目前,Deepmind團隊將陸續公布總共50局的alphaGo Master的左右互搏棋譜,供人類借鑒。
https://deepmind.com/research/alphago/alphago-vs-alphago-self-play-games/
最近很多高手都在模仿阿發狗,還有對外圍會更重視一些
非棋手強答一發。
我對圍棋只有一丁點兒的了解,小時候爸爸教過幾天,家裡有棋譜自己看過一些。後來和來家裡玩的叔叔下過。又在爸爸的陪伴下看了棋魂……
雖然不會下,勉強算是知道圍棋是怎麼回事吧,還是有些感情的。
我狗(對,我狗)讓我重燃了學棋的熱情。
希望谷歌物盡其用,讓我狗再研究研究定式什麼的,出本教材!!!
我一定買,認真學。
多了去了,最直觀的就是現在一水的開局點三三了。這背後代表的是alphago對棋形厚薄與價值判斷的顛覆。
另外無數的定式也被重新審視,最直觀的一個是妖刀,一個是星位掛角後二路飛角。前者體現的是貼在對方厚壁上的殘子也是有價值並可以利用的,歸根到底還是子效判斷問題。後者完全是價值取向問題,即二路飛角本身就是虧的,現在職業比賽里星位掛完角後選擇二路飛的已經幾乎絕跡了,可見alphago的影響多強大。要知道這個定式可是剛開始學棋就要知道的最基礎的兩個定式之一,和小目托退齊名。
音樂軟體早已經實現無錯地演奏曲譜,然而聽眾欣賞演奏家微妙的情緒變化和不期而遇的「錯誤」。工業品質量穩定,價格低廉,然而奢侈品行業依然活得風生水起。AlphaGo封神,接下來棋手們或許可以嘗試,如何讓「情緒」或「錯誤」變得更有趣,延伸出無用之用。事實上,很多人記憶深刻的圍棋是虛構的珍瓏棋局。說到底,對於大多數人來說,接觸圍棋,是覺得圍棋應該很有趣,而不是圍棋可以提供贏的結果。
勉強業二答一波
感覺阿爾法狗下的棋是一種應激反應,可能在布局階段有一定獨特的想法,但是在接觸戰中還是針對對手的下法來應戰,可以說妙手和高效率手連出,但是一種下法是根據具體的棋局來講的,值得學習,但要靈活,不能照搬。
我們現在看到的是勝負的結果,但是我們都知道,我們最看重的還是怎麼提高我們自身的水平,略偏激地講,戰勝阿爾法狗幾乎不可能,不能講我們人類棋手不勤奮,同樣不能寬己嚴人,這樣的棋局帶給我們的是一種藝術形式,我們最能體會到的,是圍棋奧妙無窮的魅力。
敬畏智慧。
雖然是外行,但我明白那種感覺。大概就是:跟電腦下五子棋的時候,有時候你感覺電腦會下一個莫名其妙的地方。然後過幾步電腦把你逼死了你才恍然大悟的感覺。而AlphaGo還可能把你逼死了你還一臉懵逼,變化太多反應不過來吧
啊這個問題我要回答。
記得我小時候學棋的時候,我就很喜歡星位小飛掛後,托三四對方三三扳後我二路連扳,如果對方依舊連扳,那我二路粘上,對方也不得不粘角上連扳的子,我再拆二。
這樣和直接二路小飛後拆二的定式相比,我等於先手爬到了c2,收到了這個價值十五目的大官子,並且爬到二路,對自己的眼型也有好處。
所以我很得意自己的發明,但老師跟我說,雖然我先手爬到了二路,但d3位的擠和黑棋c4位粘交換,把黑棋撞厚,以後白棋就沒有b4二路點的手段,並且因為多走了兩手,相當於把自己走重了。
老師的話讓我印象深刻,所以我直到現在,下棋還是極力避免走重,有點類似吳清源的風格。直到電腦也下出托後連扳的手段,我才感嘆,要是當年有電腦,我可能就不會把棋走薄,而是木谷實那樣厚實取地的風格了。
你責我胡說八道,全因我洞見太早。
大概,也許,極可能,但終將實現以下場景:
人工智慧用遠超人類的高速計算和多層次結果推測,開拓有效新起手式。該全新起手式經由人類棋手再分析後得出數個更優解,在對弈中因應時勢擇機執行。
延伸預期:
嵌入式的腦-機複合智能體或稱碳-硅二基複雜智能體,用基於馮諾依曼體系的強邏輯高速晶元,對歷史客觀數據進行計算→輸出多元決策建議及其各自支撐信息→經由人類大腦進行強主觀複核→判斷在未來態勢背景下可能的最佳執行時點→返回"優選建議-執行時點"融合矩陣→計算晶元計算預期執行時點的最大概率態勢背景→代入矩陣並經再計算後輸出最最優結果123→供人類決策→投影至大腦前庭→擇機轉化為現實行動。才是人類文明飛速發展後,在未來的真正形態啊。
未來之未來:
按此預期,性別差異將逐漸模糊至消失,婚姻經濟同步失去其存在之必須約束。技術進步帶來的無性繁殖將加速婚姻關係消失速度。未來天空上,透明大腦匣子漫天飛舞。所有衣食住行等為軀幹服務的行業產業,滅絕殆盡。
面向未來的廣告:
1、重溫遠古母星時代元人類之性快感,請速來我司。
2、插入電極,盡享元人類性別差異所獲性快感。
3、體驗真實安全可靠,多種性別匹配任選。
面向未來預期的銷售:
現出售未來有效VIP金卡(消費滿N元以上,折扣S0%-S1%),限此乎酬賓,八折僅售人民幣捌萬捌仟捌佰捌拾捌元。微信已於今晚開通現金收款業務。數量有限,先到先得。
未來用卡腦補場景:
客人您這次需要男男快感,還是女男快感啊?
請出示您的快感獲得既往史,我們的專家組需要對您適用的電流電壓進行討論呢。對哦,煩請客人您出示本次"人類性快感體驗"費用已繳訖的發票給本腦看一看。
alphago是人工智慧找到的高於人類的一個局部最優解,人類棋手能做的是學習這個優於自己的解,承認人類解和人工智慧解在解空間中的局限性,對全局最優解的尋找有了一個概念。
產生的影響按照柯傑的話來說就是:沒有什麼祺是不能下的
前人按照自己對圍棋的理解總結了好多經驗,然後沒有真正理解圍棋精髓的後人就紛紛拿來當真理當定式,然後圍棋也就失去了本應有的魅力全變成了套路。
本來覺得狗狗通過運算打破了舊的模式對圍棋發展本身是好事,but現在看到的初級結果就是一眾的不明就裡也跟著狗狗一樣開局就用點三三,說不定master的那60盤祺最後變成了新的定式。
哎!
推薦閱讀:
※如何看待2016年3月柯潔表示 AlphaGo「贏不了我」?
※有沒有大器晚成的圍棋國手?
※如何看待柯潔將於 5 月底與 AlphaGo 進行的人機大戰?這對圍棋、人類和人工智慧會有什麼影響?
※如何評價吳清源的一生以及他對圍棋所做的貢獻?
※職業圍棋比賽中有哪些冷僻的開局?