Alpha Go作為AI,有哪些特點可以被人類棋手利用將其擊敗?
拋磚引玉,在近期關於AlphaGo的相關報道中,往往提及AlphaGo是依靠最佳概率的方法來決定走子。
1.這是否是AI的一個基本策略2.如果這是AI的下棋方式,那是否有可能利用這一規律,設下陷阱,用每一個最佳概率引導AI進入絕地?(受到科幻小說《文明》的啟發,給機械文明不斷設下合理的陷阱)3.在近期的對戰中,棋士柯潔等人是否有注意到這一點並有意識地去設局?
-----完善表述: 1.產生局部最優解是否是AI的下棋方式?2.在1成立的情況下,是否可以設局,引導AI的局部最優解偏離全局最優解?
3.在近期對戰中,棋士柯潔等人是否注意到這一點並有意識布局?
用BetaGo擊敗它
談些個人觀點:
1、概率最佳確實是AI的基本策略,因為做不到窮舉就不能保證全局最優,又要追求獲勝,只能退而求其次,盡量選擇獲勝概率大的點下棋。從這一角度看,可以認為是局部最優解。
對於2和3,我覺得題主更為關心的是,2從理論上是否可以通過設計,逐步引導AI走向敗局(注意偏離全局最優未必導致輸棋)。3這種設計人類棋手能否實踐。
2、理論上應該存在這樣的設計。因為AI落子是基於最大概率策略,這就是說只要AI對當前局面做不到窮舉,那即使AI選擇某個點落子,依然有可能會輸棋。舉個栗子,假設輪到AI下棋,AI判斷概率最高的點獲勝概率是80%,就意味著在AI看來,仍然有20%的變化會導致輸棋。因此如果每次都向AI判斷的會輸棋的局面下棋,就可以戰勝AI咯。
3、BUT......上面一串美好的場景人類實踐不來。再想上面的栗子,能實踐的前提是,AI的對手至少要和AI有同樣的計算力,知道AI算出來的哪些變化對自己有利,哪些對自己不利。這就是尷尬的地方,即使我們知道AI演算法是什麼,我們卻不知道它算出來的結果意味著什麼。所以這裡,問題的關鍵在於誰站得更高,對於圍棋來說就是誰的計算力更強。現實情況很可能是,AlphaGo把人類棋手的所有變化都算到了,引導人類棋手向敗局方向下棋……
因此,理論上成立和可以實踐其實是兩回事……或許下每步棋之前都加入驗證碼可以。
說一點微小的看法。
這個問題其實挺矛盾的。阿法狗需要從無數的對局中獲得最佳方案,並且每下一次都能變成它的經驗,就是說,你可以給一些錯誤的對局經驗影響它的判斷。這次你贏了它,同樣的辦法很難重現第二次。但是畢竟是人類自己製造的,別說贏回來,砸了它都行。製造阿法狗就是為了在某些方面替代人類,現在這樣不是挺好的所以戰勝它是沒有意義的,相反戰勝不了才是有意義的。
靠人類自己不太現實,圍棋的規則和模式導致人類理解圍棋效率低下,無法對圍棋進行全面探索
以我的理解,可以嘗試跟AGO下可悔棋的快棋,世界頂尖棋手應該是可以找到贏AGO的下法.
如果仍舊贏不了,那麼說AGO已經領先世界第一棋手讓兩子的程度了,至少.這個時候的AGO就有點嚇人了...說明這60盤的棋手根本不是因為某一手失誤而輸的,是全面碾壓了.聶聖說不打勺沒準能贏,那就給他悔棋,看看能不能贏唄...
另一個方法就是利用2個AGO對下,人類從中研究缺陷.這個方法感覺不如上一個不好意思歪個樓我一直在想,假設人類在人工智慧面前再無勝算的前提下,兩台資料庫和演算法相同的alphago1和alphago2對弈,結局會是怎樣?
贏的方法或許有,但都是為贏而贏,稱不上棋的正道,更稱不上窮究棋理。
計算、子效這些路子已經走不通了。能贏的大約都是些不能重現的險途,歸根到底一著的好壞要放在全局放在終局來看待,面對Alpha Go下的棋,得是顛覆性的勝利。
人腦計算力太弱,根本不知道alphago在想些啥,也就無從誤導吧。。況且它是在按照贏棋的最高概率下棋,這一點上也誤導不了。
alphago可以開兩個啊,利用好這點絕對可以擊敗。人類也是在每一步追求每一步的綜合勝率最大化。幹嘛非要搞一些奇淫技巧去針對alphago呢。
樓主想打敗AI來搞個大新聞嗎?
推薦閱讀:
※計算機對19路盤圍棋進行窮舉法無法算出最優選擇,退幾步,9路盤計算機能算出嗎?
※當圍棋不再是人腦能夠競爭。職業和業餘的棋手還一樣愛棋嗎,一個有著不可戰勝對手的遊戲?
※如何看待 AlphaGo 的 GoRantings 等級分超越柯潔,成為世界第一?
※李世石和AlphaGo的第四盤白78手妙在哪裡?
※面對沒有情緒的計算機,人類的情感可能給比賽帶來哪些不穩定因素?