GTO在德州撲克實戰中是不是玄學?

我打現場300/600,500/1000,諮詢過這個級別的玩家,都沒人覺得GTO有什麼用,在你們看來,GTO是德州撲克的一門玄學么?


儘管很多時候剝削策略盈利最高(同時存在被反調整剝削的風險),但是GTO並不能說是純粹的玄學或雞肋。GTO是很牛X的無敵防守策略,只要對手不是GTO的就有犯EV為負的錯誤的可能(當然也可能運氣無敵好,雖然不完全GTO,但是所有選擇都是EV=0不犯錯),GTO的策略就能獲利。——雖然以我們大多數人的水平之低用不到也用不了這樣的武器。

見:

知乎專欄 採取GTO策略是否EV=0?


首先,提問者玩的等級實在有點高,讓我感覺我的作答可能有點班門弄斧了。所以呢,小弟我真的只是虛心來跟大家交流的。

關於任何一種撲克理論,請注意他的各種assumption。我是從will tipton的書中學到的有關GTO的知識的,這是非常依賴數據的一個概念,到底有用沒有,從長遠來看,在樣本數量足夠的情況下,是有用的。

第一,GTO是否適用於9人桌的cash局,這是個問題。亦或是說,GTO這個概念到底怎樣應用到9人桌的cash局中是個問題。目前來看,GTO在HEADS UP SNG中的應用是最為有效的,兩人桌的遊戲,每一個動作都是針對對方的,是實實在在最有效的信息。在9人桌上,一個REG可能會對另一個REG打得很緊,卻對同桌的FISH打得很浪,你要是把他對fish的動作不加思考的就列入其各種頻率中,進而用這些頻率去指導你對他的動作,我個人覺得,這是有偏差,也是不合理的。

第二,GTO一直都有一個前提,對手是一個同樣也會調整,有一定撲克基礎的人,如果你的對手是一條mad fish,你對他玩GTO,就是演戲給瞎子看,沒用。

第三,在現場打牌有個問題,沒有輔助軟體的幫助下,很難精確地計算出對手的各種頻率。就算你是最強大腦,能夠記得住各種頻率,但現場比賽手數少,造成的數據波動性很大。舉個例子,一個NIT可能連續抓到AK,KK, AA, 連續好幾次preflop 3b,在別人眼中,他簡直跟瘋狗一樣,可是,他僅僅就是運氣好,連續抓到好牌了而已。那麼,如果你依據五手牌或是十手牌就去定義一個對手,從我的角度來說,這是欠理智的。

第四,我最近一個月在PS上單挑打了1萬多手牌的HU,面對了各種各樣的對手。用PT4看了看自己preflop的3b%,只有10。這也非常準確地反映出了我自己的問題,這也確實是我的漏洞。同樣,自己一開始在BB上的ev甚至比SB上的ev還要多,後來經過點撥,主動調整,加大了IP時3槍bluff的頻率以及river bluff的頻率,到現在,sb的ev大概是bb的2倍。當然,儘管如此,大牛還是說我手牌數量不夠,還不能完全說明問題。

可能平時你不知道自己玩牌有那麼多漏洞,當記錄下你的一切動作,化為數據時候,你會發現,還是有很多可以提高的部分的。感覺GTO在牌桌下才是最重要的,至於在牌桌上,尤其是線下,我不敢妄下評論。

最後要跟提問者說的就是,任何一種理論都有他的前提(assumption),如果您要應用的話,請務必注意這些。關於GTO,我整整看了800多頁的英文書,也感覺也只是淺學一部分,希望各位大神指點。


GTO是撲克的底層原理研究,可以類比為哲學(玄學也是哲學的分支)。

打個比方說開車,普通開車你學習交規,考個駕照就可以了;你要享受高速快感的話,需要多了解一下技巧;做職業車手需要了解汽車各個部件的性能;頂尖車手也許會需要了解汽車的底層原理。

人腦的限制,決定了GTO大多數只能用來複盤或者硬記一些場景下的結果來使用。


GTO就好比量子物理,現場撲克則有如天體運行。


首先,國內玩家對GTO的理解和描述經常是有誤會的。

這裡我拋一個定義:當對手單方面無法通過調整他的策略來提高對我們的EV時,我們此時的策略是GTO的。

舉個大家容易理解的例子:

比如說我們常見的石頭剪刀布,如果我們的策略真的是隨機的1/3,1/3,1/3時。對手怎麼樣調整自己的猜拳頻率,都不可能提升對我們的勝率。這時候我們就是GTO的。

但是,當前通過計算機我們看到的GTO策略是極度混合複雜的,人腦再強也無法完全做到,畢竟人腦無法遍歷所有的範圍,也不能隨機掉自己的頻率。

但GTO在撲克實戰中並不是玄學,而是具有重大意義的。

我舉兩個場景來說明:

第一個是當我們新坐下一桌的時候,面對一桌陌生的玩家,我們沒有任何對手的歷史信息的情況下。我們將努力的模仿GTO策略,來儘可能的少被剝削。我們需要一定的對手的手數來獲取其他玩家的信息,包括玩家的類型和手牌範圍的上下限。進而我們才能採取基於GTO的剝削策略獲取更大的價值。

第二,我們怎麼知道玩家漏洞究竟是什麼樣的?拋去old school定性式的描述,有沒有精確的方法來衡量?舉個例子:

在這樣一個面,我們發現對手的cbet頻率明顯高於50%,比如高達75%以上,就意味著他咋呼的過多了,我們用更多的牌去加註他,他就難以抵抗。這個例子是為了說明,GTO策略的研究,為剝削打法設立了一個標準,任何偏離GTO標準的頻率,在實戰中如果被發現,都可以針對性的調整進行剝削。

而在國外,使用piosolver來尋找並構建GTO策略和range已經是非常普遍現象了。但在中國有能力的玩家依然比較稀有。


一、 什麼是GTO?

GTO(Game Theoretical Optimum),首先要了解這個辭彙,中文直譯是博弈理論最優(策略),直白點說也就是博弈論中的最優策略。那麼我們如果要了解GTO,那就必須了解博弈理論。

博弈論(Game Theory)本身是一門學科,而且是比較前沿的那種,那麼我這裡就一筆帶過,講一些最基本的原理。用一個比較簡單的定義:博弈論是二人(或者更多人)在平等的對局中各自利用對方的策略變換自己的對抗策略,達到取勝的目的。博弈論考慮遊戲中的個體的預測行為和實際行為,並研究它們的優化策略(以上沒看懂的話問題也不大)。

二、 納什均衡

說到博弈論,就必須得提到納什均衡。納什均衡是這樣一種狀態:博弈中的每一方都不能通過單方面改變自己的策略來增加收益。現在一些撲克pro熱衷於討論的GTO,其實就是納什均衡的一部分。那麼除了裝逼以外,納什均衡在撲克中有什麼其他意義嗎?我們可以從兩個角度來看這個問題:

1、 對手不能通過調整打法來剝削我們的EV;

2、 面對對手的策略,我們做出了最優對策。

由此看來,納什均衡可以在撲克中幫助我們實現「絕對的防禦」。而其實所謂的GTO,就是求解撲克中的納什均衡解。關於如何求解納什均衡,我不在這篇文章中過多討論。目前大部分的撲克pro會藉助各類軟體來直接計算納什均衡範圍,幫助他們復盤學習。我這裡想談一下納什均衡意味著什麼。

從之前的描述其實已經可以看出,納什均衡是不能通過一個人來實現的:你可以做出納什均衡解中的你的部分的行動(通俗來講就是你是GTO的),但如果對手不按照納什均衡解來行動(通俗來講就是對手部GTO),就不能實現納什均衡。

而撲克中的納什均衡,幾乎都是混合策略納什均衡。這裡我們不深入講純策略和混合策略,大概意思就是:你拿著同一手牌,純策略是你必須100%bet或者100%check,而混合策略可以讓你bet一部分,check一部分。總之,從定義上看,混合策略納什均衡解意味著你讓對手陷入了這樣一個狀態:對手無論選擇哪一種純策略,他的EV都是相同的——當然這也意味著他無論採取什麼樣的混合策略來應對,他的EV也是相同的。

三、 有關GTO的一些錯誤觀點

從上一節末的結論出發,再結合撲克是一個零和博弈(不考慮抽水),於是很多人會得出這樣一個結論:

在撲克中,如果我是GTO的,那麼不管對手是不是GTO,我都會長期保持不輸不贏的狀態。

他們還會列舉一個剪刀石頭布的遊戲來加以佐證:剪刀石頭布中,如果我分別以1/3的概率出剪刀、石頭和布,那麼無論你怎麼應對,我們長期的EV都是0(在這個例子中確實是完全正確的)。

而在撲克中,也有一些例子可以「證明」一個類似的結論:在河牌我們用2/3的nuts和1/3的bluff做一個底池的下注,此時對手的中等牌無論怎麼call,他的EV都是0,而我們的EV恆為一個底池(這也是一個完全正確的例子)

我的觀點是:在撲克中,這都是一些過於草率的錯誤結論,只有在非常嚴格的限定條件下才可能成立。

我們追根溯源,談一談納什均衡的求解:在求解納什均衡的過程中,我們必須首先剔除嚴格下策。

什麼叫嚴格下策?在撲克中,fold掉nuts,用完全空氣跟注就是明顯的嚴格下策。在剪刀石頭布當中,出剪刀、石頭、布都不是嚴格下策,因為他們總是有可能贏的。而在經典的類撲克博弈模型AKQ遊戲中,跟注Q就是嚴格下策。在撲克中,大部分情況下我們的範圍內都會存在一些嚴格下策決定。換句話說,對手的範圍完全由中等牌力構成,而你的範圍完全兩極化的範圍這個假設太過於理想化了。既然你不能保證你的對手不會做出嚴格下策的決定(類似27o call 3bet,hit or fold這樣),那麼你就不能應用所謂的EV相同法則。而顯然,採取了嚴格下策的對手會使得你的整體GTO策略自動獲利。

總之,以上結論只有在對手的策略集完全剔除了嚴格下策以後才是正確的。

原文鏈接: 關於GTO的一些分享 - 撲克人


GTO肯定不是玄學,但同時覺得GTO無用也是很正常的。

首先,絕大多數玩家都是高度不平衡,極易被剝削的(包括很大部分的盈利玩家比如我),對抗這種玩家時(其實就是幾乎所有牌局中),關注點當然應該落在對手的漏洞而非自身的平衡上。

舉個栗子

「比如在單挑中,在所有AXX面上我任何2張都跟注snowie 3bet後的cbet,然後只要snowie check turn我就下注,snowie從來沒有跟注過,且其轉牌下注頻率在我看來也不夠高到來讓它以這個頻率放棄轉牌。」

這是@rt dk在描述對抗snowie時的一段話,即這裡我們發現了對手只要check turn必然是x/f的漏洞,自然的我們簡單的下注來攻擊就好了,沒有必要check behead(哪怕一次)來平衡我們在turn上的下注頻率。

換言之,我們即便自己再不平衡也要儘可能地剝削對手。比如經常能看到的一句話

「如果對手被我們n倍下注尺度的3bet時,棄牌率達到m%,那麼我們就可以用任意兩張牌去3bet他。」

換成石頭剪子布就是

「如果對手出石頭的概率最大且不會調整,我們就100%出布去剝削他-_-||」

當然,世界上還有一小撮很難剝削,相對平衡的玩家,為了贏錢的話,簡單的不跟他們玩就是了(當然也廣泛的包括不易被當前水平的自己所剝削的玩家)這種情況下,GTO也無法用來剝削這些玩家。

最後,NLHE好像暫時還沒有一個嚴格而完整的GTO策略,即便想學也沒有明確的標準,如果只是趨向於平衡,趨向於XXX,大部分玩家應該都是朝著這個方向在走,並沒有因為這個提出沒多久的概念而發生實質性的改變。


當然不是玄學,一個掌握了完美GTO的選手(當然幾乎不可能就是了),他的調整和偏離可以說是最有針對性的,最到位的。

GTO本身剝削不了人,但是可以讓你做出更精準的剝削策略決定。


博弈均衡就是大家都這麼玩的時候沒人能從偏離這個均衡獲利。問題在於大多數人都是遠離均衡策略的,這時候最有利可圖的策略肯定不是gto,學過博弈論就很容易理解


推薦閱讀:

使用poker snowie或與其對抗是怎樣的體驗?該軟體對提高德州撲克的水平是否有幫助?
嘗試升級nl25遇到的各種問題?
關於德州撲克控池,大家覺得有哪些誤解需要澄清?
德州撲克75同花這樣的牌在前15%的牌力裡面嗎?前百分之十五的牌都有哪些?
從概率上看,深刻而持久的下風期是否真的存在?

TAG:德州撲克 | 德州撲克技巧 |