國際象棋和圍棋都已經進行過「人機大戰」了,之後還有什麼遊戲值得人工智慧挑戰嗎?

比如德州撲克?


Dixit(隻言片語)

不求完虐人類,只要能正常遊戲就行。


圍棋這種純離散的問題,就是時間問題,都是量變。

人工智慧要取得質變的話………………………

「少年,玩心嗎?」


deepmind以前玩Atari,現在玩go,doom,盟軍敢死隊等都只是為了測試和驗證他們的演算法,並非目標,真正的目標還是AGI。後面主要看他們是否能夠將AGI成功擴展到醫療等具體應用上,這才是真正的里程碑。

很多東西都來自長期的積累,IDSIA/TUM、Alberta多年的研究正在deepmind開花結果。


講真,如果一個機器人能夠做到「理解人類話語+整理邏輯思維+快速語音反應+適時感染觀眾」的話,就已經夠了。

對,我說的就是辯論


@吳小葉的答案很有意思。我認為所有非全局可見的遊戲都值得AI下一步進行嘗試,軍棋這種一開始看不見對面如何排子的遊戲就很有意思。這個在人工智慧領域叫POMDP(partially observable Markov decision process 部分可觀測馬爾可夫決策過程)。POMDP比完全可見的MDP問題要難,很多人都在嘗試求解此類問題。最近大熱的深度學習演算法在這方面的報道比較少見(有一個玩文明2的例子)。在POMDP問題中,比較有意思的就是遊戲AI了。文明這個遊戲太拖節奏了。Starcraft2為代表的RTS和Dota2為代表的MOBA都是值得AI去挑戰的遊戲。這類遊戲代表的是最難的連續狀態空間(時間上和空間上都是連續的有無窮多個值)的POMDP問題。如9號AlphaGo宣布挑戰星際爭霸的報道。我覺得針對此類問題的求解會極大的推動人工智慧演算法在實際中的應用。而且也能進一步推動競技遊戲平衡性的提高和競技水平的提高。想想還有點小激動呢。


獨立 AI 的非信息對稱博弈遊戲。

比如橋牌。

四台獨立的 AI 機器和頂尖橋手進行對決。


十台阿法狗對黑DOTA

現在dota2 ai被削了一大刀,落到2000分水平了

之前大概3500水平的時候也只是靠著團戰執行力,單論操作還是不行……

而且高地處理一直是屎………………

很想看這種在系統上靈活性極高的項目上,AI的BP,分路,分位,戰術,,加點,出裝上會怎麼自我選擇……

至於操作這種基本功類的……老版人機的補刀就夠慘無人道了,畢竟人家不靠感覺直接算的數據……

主要考驗的應該是ai的團隊意識計算,誰來打錢誰來保大哥團戰誰先手送死……

以及會不會扔高台卡人溝壑斷兵這種腦洞級的戰術……

希望ai能打出很多之前並未被發現或者普及的野路子……


我錯了,機器學習確實是可以完美自學四國軍棋的所有戰術和技巧。謝謝評論區的批評指正。

————————————————

我來說一個可以實現的:四國軍棋。

兩台AI在互不交流信息的情況下合作與人類下暗棋。按照規則,AI和人一樣,只能看到各自棋子的情況,吃子、兌換還是被吃。

(圖片是網上隨便找的)

四國軍棋沒有圍棋那麼大的複雜度,局面非常簡單,更加沒有逼格,掌握起來非常容易。但是它與圍棋有根本的區別,一是本身棋子暗置,較量的點除了運氣之外,更多的心理的博弈,AI的優勢遍歷和計算較少;二是需要與隊友配合,兩台AI能不能互相理解對方的「心理」,進行合作,是很大的看點。

舉個小栗子:哎呀,我的旅長被對面不明物體拍死了,它是什麼?師長?軍長?司令?我是用炸彈去炸還是用司令去碰?看這個子,表面上橫衝直撞,實際上遇到我對家沒有行動的後排子的時候假裝轉向進攻,實際猥瑣避讓,八成是個大子,又不能排除師長裝猥瑣的可能,我先去嚇他一下,順便調整一下炸彈位置,裝個工兵勾引一下??這是人和人博弈的一個小片段,其實只有幾秒的思考。AI要是用左右互搏的方法能學會這個??那就真智能了,應該是成精的狗了。

另外,雖然人機大戰不難,可是人和人下棋是一回事,人和AI下軍棋??畫面太美,不敢想??人什麼時候跟電腦心理博弈一把。

關於概率的事情,補充:獲得對方棋子準確信息的方法是用自己的子與對方互動,吃或者被吃。如果每次都用子去碰,那必敗無疑。還有,你知道對面的炸彈在哪嗎?團長吃炸彈和團長吃團長的形狀是一樣的哦?

舉例:AI:對面這個子是師長、軍長、司令的概率分別是1/2、1/4、1/4,經過計算,用司令去吃的收益最大。人:我的軍長吃了他一個小子,他另一個子就調過來了,呵呵,司令,看我炸彈陰你一把。boon。

現在圍棋AI已經展現了驚人的學習能力和計算能力,但是很多人認為它還不智能。舉個題外例:一隻鳥,飛到水裡抓了一條魚,很平常;一隻鳥,叼了一小片食物丟在水裡,然後在水邊靜等,把游過來吃食的魚抓住,就很神奇。一個具備極高判斷力和計算力的AI贏棋不新鮮,他還只是憑藉蠻力獲勝。如果AI可以跟人類互動,AI可以跟另一個AI互動,那就更上一層了。

四國軍棋和圍棋象棋不同的是,四個人獲得x的信息是不全面的不一樣的。圍棋的黑白子明明白白地擺在那裡,而軍棋只能看到自己的一部分棋子。雖然逼格比不上圍棋,但是軍棋自有特色。

其實我特別想看AI與人組一隊對戰另外兩個人或者AI。AI是怎麼與陌生人類合作的,這是圍棋看不到的吧。

補充:答主不懂AI,只是在之前阿爾法狗火的時候跟風看了幾篇科普文章而已。四國軍棋總共129個點,100個子,而且每局步數很少,局面複雜度下降很快。AI想要計算的話難度遠遠小於圍棋。


編段子


AI編程啊。

以後可以自己改自己代碼了。

天網時代已經來臨。


斯諾克——個人認為是地球上最難的運動。

不但要對局勢進行複雜的判斷和計算,還要具備高超的身體技巧。

個人認為如果將來能實現斯諾克的機器人VS人類,公平起見,機器人必須是人形機器人

像這樣:

所以,單從身體技巧層面,這個人形機器人必須能作出以下姿勢:

這樣的姿勢:

還有這樣的:

還得做出這樣的姿勢:

偶爾,機器人也得練習一些表情:

這些都是為了應付檯面上的複雜球形和局勢。

當然,斯諾克對於機器人還面臨著一大難點:準度

斯諾克使用的球桌長約3569毫米,寬1778毫米,對於機器人,需要多少零部件來協調運作,並精確計算?

如果說AophaGo是純軟體挑戰人類大腦,那麼斯諾克更看重的則是硬體對於軟體命令的執行!

再說桿法,這與走位相關。

斯諾克球員為了完成精確的走位,要長年累月的練習基本功——高/中/低桿,「縮桿」,「定桿」等等……桿法與球杆和母球的接觸點、發力大小、發力方式等等又息息相關。職業球員能用低桿打出高桿跟進的效果,就在於長期練習下形成的經驗。

這還沒算加塞與母球的分離角呢,不同力度加不同位置的塞,會形成完全不同的母球分離角,而加塞對目標球的路徑也有影響,為了保證準度還要考慮目標球離袋口的距離等等等等因素。

再說環境。

室內溫度、濕度都會對球台造成影響,還有母球的靜電問題。

最後一項重要的,也是和圍棋最大的不同之處,就在於——斯諾克的可能性是無限的。因為對手要上場,他可能把母球停在任何位置,其他綵球也可能因受到撞擊而改變位置,因此每次機器人上手幾乎都要重新計算整個球台。圍棋是有格子限制的,因此無非就是計算各種可能性並求出最優解,斯諾克呢?

當然,機器人也有優勢——沒有情感,發揮極其穩定。

我覺得人類近期很難造出能完爆頂尖職業球員的人形機器人。

目前人類研究出的「撞球機器人」,大概是這個水平:

打撞球的機器人

但這和人形機器人差的太遠,兩條腿是履帶。而且停留在規則簡單、檯面小、難度低的中式8球層面。而且視頻中,機器人全程只是在秀準度,根本沒有對手上場,更別說策略上的博弈。機器人的「手」還碰到了球——犯規……

這個答案是從人的角度考慮的,從機器人角度考慮的話,可能會簡單很多:

我不要走位,只要我的計算足夠精確,只要檯面存在理論上的下球機會,我打進就行了。

但我希望一場公平的比賽應該是:機器人擁有與人相似的形體,用雙腿走路,用胳臂和雙手持桿,使用正常材質的斯諾克球杆(楓木等),打一場斯諾克。

希望在火箭退役前能來這麼一場,無論輸贏。


好問題,就拿題主舉的德州撲克例子來說,去年加拿大University of Alberta計算機系在science上發表了論文,在單挑限注有必勝策略:

http://science.sciencemag.org/content/347/6218/145

http://ai.cs.unibas.ch/_files/teaching/fs15/ki/material/ki02-poker.pdf


強烈建議飛行棋


坦克世界

國服

假期,晚上


談戀愛


Alphago戰勝了圍棋,能否戰勝四國軍棋?

今天即將開始第三場人機大戰,人類能否試探出alphago的上限應該是最大看點。當一些圍棋大師評說alphago確有失誤的時候,但它贏得了勝利。面對勝利者,你很難評價他的上限——伊辛巴耶娃每次只破1cm難道是她真的每次進步1cm?沒必要並不能代表做不到。所以我認為只有當人第一次戰勝alphago之後才能初步判斷它的實力,否則所謂的違背棋理可能只是在否定地心說而已。

謹慎而言,Alphago的圍棋水平已經與人類圍棋界中最高水平旗鼓相當了。圍棋——所有棋類中複雜度最高的,現階段無法用窮盡法暴力破解的——正在被計算機超越。我們可以自豪,因為計算機以及神經網路是人類想出來的;但我們也可以悲傷,因為人類終究敵不過計算機,所謂的大局觀,棋感,意識可能只是對局面無法把握的託詞。那麼作為心理活動的最具代表性的棋類——四國軍棋,能否擺脫被AI統治的命運呢?

圍棋是一個信息完備的棋類,即所有信息都是可以被電腦所接收,不存在誤導和欺騙,人類所謂的陷阱,在電腦面前只是一組數據(當然,也許人可以根據計算機的演算法布置陷阱,但迭代無數次後的alphago連研發人員都只能當做黑箱了)。

四國軍棋(特指四暗和雙明)屬於信息不對稱的棋類,贏棋公式可以看作P(win)=a*X+b*Y-c*Z,大致可以理解成abc是三個參數,X是擁有的子力差距,Y是擁有的正確信息,Z是擁有的錯誤信息。計算機可以正確計運算元力差距,但是信息方面如果完全依靠概率統計,就會陷入人類的反思維陷阱。舉例而言,概率統計告訴計算機,80%是司令,20%是軍長,人類的經驗中也大致如此,高概率是司令,低概率是軍長,但是人可以在某一盤棋中反其道而行之,讓計算機得到錯誤信息。

(補充:看到有些人認為軍棋依賴於判斷就落入下乘的想法,雙明也有類似「不做判斷就是最好的判斷」這樣的名言,實際上判斷是必不可少的,軍棋大師們除了走位好,判斷也是十分了得的。計算機可以少做判斷,但它無法避免判斷。當兩個人猜拳的時候,X知道Y有60的概率出石頭,30%的概率出布,10%的概率出剪刀。理性分析,X會出布立於不敗之地,但是如果他的對手Y捕捉到這個信息,就會選擇出剪刀,再假設X知道Y有這個信息,就會改變策略。這裡就是信息的博弈了。)

既然計算機不能通過概率統計簡單擊敗人類,聰明的工程師們肯定會集思廣益想出其他招數。比如像我在製作小車的時候一樣設置檔位,不同模式可以根據局面的優略(優勢求穩,劣勢求變化)調整,可以有3種、30種、甚至300種模式進行變化,讓人類找不到規律,人類就無法反思維運子了。那麼問題來了,計算機可以找到人類的規律嗎?人類的心理活動是很複雜的,靈光一現的決定計算機能否估算到呢?第三屆大師賽決賽的決勝盤,西瓜橙子 和楊康的軍長面對明司令無所畏懼,計算機會做嗎?最後勝負手的那一步,小邪軍旗面臨威脅,卻不予理會,計算機能算到嗎?

這些都是未知的,沒有發生的事我們往往只能憑藉感覺判斷。話又說回來,我們所謂的感覺是否在計算機眼裡看來只是我們基於自身認知以及對周邊環境的認知而做出的高概率選擇呢?假如計算機把人類的情感和感覺都能抽象成數據的時候,它就成為了「神」。


你讓他談個戀愛,找個妹子試試?

他要能搞懂女友為什麼生氣也算是造福人類了!


(???ω???)和大魔王打打乒乓球


我想請AI同志和我詐一把金花...


德州撲克


推薦閱讀:

身為程序員, 2017年你有什麼一定想實現的願望?
你覺得Alpha Go 對李世石會幾比幾贏?
機器學習中如何處理缺失數據?
"圖靈機器人"(http://www.tuling123.com/)這款智能自動問答應用在業界處於什麼水平?應用前景如何
無人駕駛車的感測器如何進行布置?需要有哪些考慮?

TAG:人工智慧 | 圍棋 | 德州撲克 | 國際象棋 |