華山論劍之GTO

GTO,是Game Theory Optimal的縮……

看到上面那段開頭,我不禁也想說「Shut Up!」幾乎所有講GTO的都是這個開頭,接著羅列出一堆理論,公式。我想大多數人看的時候都是看個開頭,然後快速向下拉到結尾,看個結論,最後回復一句:「果然是高人,學習了。」你問他這篇具體寫的什麼,他可能會回答你:「太長了,都是公式,估計不太好懂,先收藏,以後慢慢研究」。然後就沒有然後了……

而且GTO這個叫法本身就容易讓人產生誤解。這裡我想嘗試用一個不一樣的方式,向大眾普及下GTO的理論,讓大家先對它有一個正確的認識。在以後的文章中,我再比較系統嚴謹地講解。

「德扑打得好,人品不會壞」,歡迎來到由「我是牌手」冠名的 high stakes poker 第九季,地點是華山之巔。這期我們依然請來了上一季表現出色的五絕(什麼?你沒看過《射鵰英雄傳》?那就百度一下稍作了解吧)。

由於上一季的裘千仞選手被五絕虐得肚子疼病發作,所以這一季將由一名新人南什來頂替他的位置。發牌員依然是我們的小美女黃蓉,郭靖也由於近年來進步神速,獲得在旁吃瓜圍觀的資格。

五絕看看眼前這個清秀的少年,互相遞了個眼色,到一邊開始討論。

他們都是的絕頂高手,通曉所有撲克理論,計算能力超越常人,並對別人有著開天眼般的洞察。所以他們每一個決定都是基於當前的狀況下從理論上講最優的選擇。

水平到了他們這個地步就已經比不出高低了,所以影響他們最後盈利率的因素就只有相對於這個新人的位置了。

去年就是因為中神通王重陽最後猜拳獲勝,搶到了裘千仞左邊的位置,才獲得了天下第一的稱號,今年除了中神通不能再搶這個位置之外,其他人對新人左手邊的位置都是虎視眈眈。

經過一番討價還價,割肉賣腎,最終的座位分配如下:

看到南什的頭像五絕更是放鬆了,原來這個南什是靠跟贊助方的關係混進來的,不足為懼。

開局後,五絕都盯著南什,希望能儘快找到他的漏洞,佔得先機。但實際上他們心裡都清楚,如果南什的水平和裘千仞差不多,那麼最後打出的結果也會和去年類似,五絕實力在伯仲之間,誰都占不到太大的先機。他們甚至可以根據南什的水平,在開始前就計算出最後結果的大致數據。

但漸漸地,五絕吃驚地發現眼前這個年輕人水平之高,竟與他們不相上下。牌局出現了非常戲劇的狀況,隨著他們不斷地調整和反調整,漸漸地,所有人都在使用一套相同的策略,他們達到了一種完美的均衡狀態。這種均衡狀態的策略從防守上是無懈可擊的,牌局中的任何一個人都不可能通過改變打法來提高自己的贏率。

最後統計出的數據表明,在可以接受的誤差範圍之內,他們之間沒有輸贏,甚至他們每個人在同一位置的贏率都基本相同。大致情況如下圖:

本圖中的純屬虛構,並非經過計算的嚴謹的結果。

由於本次活動的目的是切磋牌技,所以沒有抽水,最後大家的盈率整體都接近於零(沒看懂的同學把各個位置的盈率相加就明白了)。

由於這場比試太過精彩,主辦方讓有著驚人記憶力的發牌員黃蓉,將牌局整理,並將他們最終使用的策略記錄了下來。新人南什憑著的精彩表現以及和贊助商過硬的關係,擁有了將那種均衡狀態以他的名字命名的特權,即南什(shen)均衡。可惜由於記錄員的失誤,文字檔案中記做了納什均衡。

黃蓉怕那本記錄流傳出去太多人知道,所以用梵文書寫。民間的人們都不懂梵文,只有一個外國人能看懂,但由於語言障礙,人們只聽懂了一點點,其中GTO這個詞不斷出現,最後這種策略就被稱為「GTO」。

這期間還有段趣聞,比賽結束後,五絕集體尿急上廁所,這時候傻姑出現了,非要和南什一起玩,於是他們進行了一場heads up(單挑)。傻姑完全不會玩,人又傻,讓南什用極具壓迫性的打法打得毫無還手之力。黃蓉發現南什使用的策略竟然如此具有統治力,於是也悄悄記錄了下來。

事後南什知道了,告訴黃蓉:「這種打法只有在和傻姑這種打得奇差無比且不知道調整的人單挑時才有用。我們的牌局大部分時間都不是單挑,並且桌上經常還有其他的高手,這種打法就更難施展了!」

黃蓉沉思片刻,恍然道:「原來如此!」,便隨手把剛才抄錄的策略給扔了。這本抄錄本後來被一個路人撿到,奉為至寶,他也略懂梵文和洋文,但又都不是很精通,最後裝模作樣地給這個抄錄本起名叫「EO」。並在江湖上大肆宣揚,EO可以達到極高的盈率,完全吊打GTO,吃瓜群眾都不明狀況,紛紛圍觀,鬧得人盡皆知。此乃後話,按下不表。

花開兩朵各表一枝,話說郭靖看得摸不著頭腦,忙追問原因,黃蓉剛想解釋,南什伸手制止,並向舉辦方提議,等五絕歸來後,由傻姑代替南什入局,大家娛樂娛樂。黃蓉看出南什有意指點郭靖,也乖乖專心發牌。

他們在打時,南什講解道:「你看,傻姑幾乎100%跟注入局,歐陽鋒這裡理論上可以很松地隔離傻姑,但這樣一來老毒物就會漏出破綻,七公在後面就可以更松地3bet和跟注,如果七公想最大化利用老毒物的破綻,自己也會變得可被利用,在他身後的黃老……你岳父也就可以更松的4bet和跟注, 以此類推。

這樣,每次歐陽鋒從傻姑那裡剝削利潤,然後再被後面的人逐層分刮。局中之人都需要在全力剝削前面的人和防止被後面的人剝削之間尋找平衡,找到那個利潤最高的點。

在其他高手面前露出巨大的漏洞是危險的,所以老毒物不能全力剝削傻姑,必須收緊一些,最後他們也會達到一種平衡的狀態,我們姑且稱之為傻姑均衡。這種狀態下他們的策略的贏率肯定要比我剛才那樣的打法低的多!這也是我和傻姑單挑時的策略幾乎很少能用到的原因。」

本以為平衡就會這樣保持下去,但沒過多久,五絕們都不約而同地換了策略,南什立刻露出讚歎的神情。郭靖則看不懂忙問:「為何他們都開始改變策略了呢?剛才那種狀態,五絕中的任何一個人不是都不能通過改變策略來提高盈利了嗎?」

南什悠然道:「沒錯,除了傻姑之外任何一個人都不能。但是如果五絕一起則是可能的。不愧是五絕,他們知道如果他們之間互相牽制,最後結果就是大家的盈利都收到影響,但他們都是精於算計之人,並且能力非常相近,所以他們幾乎同時算出了另外一種均衡狀態,我們可以稱之為靜默合作均衡,這時的盈利比傻姑均衡狀態下要高出不少的。

之前他們沒辦法最大化利潤,是因為他們的一部分牌力的價值用在了互相牽制上了,等於其他人替傻姑防守了一部分的剝削。五絕很快意識到這點,所以他們選擇靜默合作減少內耗,將全部的牌力價值都最大化的用來剝削傻姑。

一旦多人與傻姑進入同一底池,他們之間通常也不做糾纏,這並非是說五絕互相使眼色或小動作,來打串通,這種屬於作弊行為,五絕這樣身份的人是不會做的。但他們都是頂尖牌手,知道彼此都能計算出目前狀況中,對每個人來說最大化利潤的均衡點在哪裡。

在這個均衡點上每個人的策略都是固定的,根據他們相對於傻姑的位置會稍有不同,他們都不約而同地選擇了這套策略,因為這樣他們每個人的利潤都比之前的傻姑均衡狀態下要高。這其中的微妙變化,不足為外人道也。也只有五絕這樣的人物,才能達成如此微妙的平衡。這局對局絲毫不比剛才我們的對局差!」

郭靖在旁聽得是熱血沸騰,非常想和上去和各位高手較量,經過黃蓉向舉辦方的求情和南什的推薦,郭靖也終於坐上了這張世界上最難的桌子。南什在心中默默的計算:郭靖的實力比裘千仞稍強,但和五絕比起來還是有一定差距的,所以他們最終的結果可能大致應該是如此:

本圖中的數據依然純屬虛構,並無科學依據。

但誰知事情並非如南什所想的那樣,郭靖竟然不像他計算的輸的那麼多,南什細思之下,恍然道:「我機關算盡,卻漏算一件事,那就是人心。這局五絕都是報著娛樂和歷練新人的心態來打的,對自己的控制就不像之前巔峰對決那樣嚴格了。於是參雜著個人的想法和情緒,他們遊戲牌局的目標悄悄地變了。」

段皇爺不想贏別人的錢,但自己也不想輸太多,於是採用南什均衡狀態下的策略。

歐陽鋒想利益最大化剝削郭靖,但洪七公會護著自己的徒兒並故意針對歐陽鋒,使得歐陽鋒放不開手腳。

黃藥師有些不待見自己的笨女婿所以會偶爾針對下郭靖,但郭靖畢竟是自己人,黃老邪最護短,也不想讓郭靖在歐陽鋒那裡吃虧,所以有時會和洪七一起針對老毒物。

王重陽不希望大家有太多紛爭,所以會從中牽制平衡。

黃蓉雖然不參與牌局,但她只想讓她的靖哥哥贏,於是會經常在牌局關鍵時刻去和歐陽鋒聊《九陰真經》。黃藥師想教訓郭靖時,黃蓉也會問黃藥師關於她娘的事情。試圖通過擾亂他們的心神來幫助她的靖哥哥。

正是因為他們有著這樣錯綜複雜的關係,結果正可謂是在意料之外,卻又在情理之中。這幾人中只有歐陽鋒和郭靖是抱著利潤最大化的目的在進行遊戲的,而其他人則各有各的心思,為達目的不惜犧牲自己的利益。南什不禁感嘆:「看來我還是需要修行啊,我計算能力再強,也算不準人心,人心是幾乎不可能量化的啊!」

這樣的想法讓他有些意興闌珊,但隨即他又釋然了,德州撲克不正是因為如此,才這麼的有魅力嗎?真正能達到五絕那樣水平的在時間絕無僅有,人們什麼都能想控制,但最後會發現我們什麼都控制不了,甚至包括我們自己。控制是暫時的,失序才是常態,我又何必做那脆弱的完美主義者呢?於是華山論劍之後,南什也隨之銷聲匿跡。

時光如白駒過隙,世間早已沒有多少人記得當年華山之巔上的那場對局,但是GTO和EO這兩本記錄卻流傳了下來,造成了江湖上的不少紛爭。沉寂多年的神秘年輕人南什突然重出江湖,旨在提醒世人,GTO和EO皆為誤傳。

「EO」只有在對手打得很差且完全不知調整時才能發生,而「GTO」則是一桌人都必須像五絕那樣的不世出的高手才會出現的狀態。這兩種狀態都只是局中人根據當時情況,每個決定都力圖做到利益最大化的結果而已。

這等於是兩種最極端的狀況:對手足夠差或足夠好。這個「足夠」幾乎永遠不夠,現實中的牌局幾乎永遠遇不到這樣的對手。更何況科技如果沒有什麼革命性的突破,人類短時間內是不可能達到五絕那樣的水準的。

但對這兩種均衡狀態的研究卻有著非常重要的意義,它們是我們在撲克海洋中的信號塔,讓我們知道自己和對手在哪裡(如果你水平足夠好的話),我們只需要做出判斷,在當前情況下,我們需要向哪篇靠近。所以GTO和EO從來都不是一套可行的策略,更不是什麼研究出來照著打,就可天下無敵的打法。

這世間從來就沒有什麼GTO或是EO,這裡只有poker。


推薦閱讀:

打德撲為什麼要凶
嚴肅點!這真的是一場很正經的比賽!
二四法則和所羅門法則的簡單數學分析
牌桌上最致命的不是運氣差,而是碰上了冤家牌?
德州撲克牌例分析(3):河牌圈的全押詐唬

TAG:德州扑克 | 德州扑克技巧 |