GTO在德州撲克實戰中是不是玄學？

01-27

我打現場300/600，500/1000，諮詢過這個級別的玩家，都沒人覺得GTO有什麼用，在你們看來，GTO是德州撲克的一門玄學么？

儘管很多時候剝削策略盈利最高（同時存在被反調整剝削的風險），但是GTO並不能說是純粹的玄學或雞肋。GTO是很牛X的無敵防守策略，只要對手不是GTO的就有犯EV為負的錯誤的可能（當然也可能運氣無敵好，雖然不完全GTO，但是所有選擇都是EV=0不犯錯），GTO的策略就能獲利。——雖然以我們大多數人的水平之低用不到也用不了這樣的武器。

見：

知乎專欄採取GTO策略是否EV=0？

首先，提問者玩的等級實在有點高，讓我感覺我的作答可能有點班門弄斧了。所以呢，小弟我真的只是虛心來跟大家交流的。

關於任何一種撲克理論，請注意他的各種assumption。我是從will tipton的書中學到的有關GTO的知識的，這是非常依賴數據的一個概念，到底有用沒有，從長遠來看，在樣本數量足夠的情況下，是有用的。

第一，GTO是否適用於9人桌的cash局，這是個問題。亦或是說，GTO這個概念到底怎樣應用到9人桌的cash局中是個問題。目前來看，GTO在HEADS UP SNG中的應用是最為有效的，兩人桌的遊戲，每一個動作都是針對對方的，是實實在在最有效的信息。在9人桌上，一個REG可能會對另一個REG打得很緊，卻對同桌的FISH打得很浪，你要是把他對fish的動作不加思考的就列入其各種頻率中，進而用這些頻率去指導你對他的動作，我個人覺得，這是有偏差，也是不合理的。

第二，GTO一直都有一個前提，對手是一個同樣也會調整，有一定撲克基礎的人，如果你的對手是一條mad fish，你對他玩GTO，就是演戲給瞎子看，沒用。

第三，在現場打牌有個問題，沒有輔助軟體的幫助下，很難精確地計算出對手的各種頻率。就算你是最強大腦，能夠記得住各種頻率，但現場比賽手數少，造成的數據波動性很大。舉個例子，一個NIT可能連續抓到AK,KK, AA, 連續好幾次preflop 3b，在別人眼中，他簡直跟瘋狗一樣，可是，他僅僅就是運氣好，連續抓到好牌了而已。那麼，如果你依據五手牌或是十手牌就去定義一個對手，從我的角度來說，這是欠理智的。

第四，我最近一個月在PS上單挑打了1萬多手牌的HU，面對了各種各樣的對手。用PT4看了看自己preflop的3b%，只有10。這也非常準確地反映出了我自己的問題，這也確實是我的漏洞。同樣，自己一開始在BB上的ev甚至比SB上的ev還要多，後來經過點撥，主動調整，加大了IP時3槍bluff的頻率以及river bluff的頻率，到現在，sb的ev大概是bb的2倍。當然，儘管如此，大牛還是說我手牌數量不夠，還不能完全說明問題。

可能平時你不知道自己玩牌有那麼多漏洞，當記錄下你的一切動作，化為數據時候，你會發現，還是有很多可以提高的部分的。感覺GTO在牌桌下才是最重要的，至於在牌桌上，尤其是線下，我不敢妄下評論。

最後要跟提問者說的就是，任何一種理論都有他的前提（assumption），如果您要應用的話，請務必注意這些。關於GTO，我整整看了800多頁的英文書，也感覺也只是淺學一部分，希望各位大神指點。

GTO是撲克的底層原理研究，可以類比為哲學（玄學也是哲學的分支）。

打個比方說開車，普通開車你學習交規，考個駕照就可以了；你要享受高速快感的話，需要多了解一下技巧；做職業車手需要了解汽車各個部件的性能；頂尖車手也許會需要了解汽車的底層原理。

人腦的限制，決定了GTO大多數只能用來複盤或者硬記一些場景下的結果來使用。

GTO就好比量子物理，現場撲克則有如天體運行。

首先，國內玩家對GTO的理解和描述經常是有誤會的。

這裡我拋一個定義：當對手單方面無法通過調整他的策略來提高對我們的EV時，我們此時的策略是GTO的。

舉個大家容易理解的例子：

比如說我們常見的石頭剪刀布，如果我們的策略真的是隨機的1/3,1/3,1/3時。對手怎麼樣調整自己的猜拳頻率，都不可能提升對我們的勝率。這時候我們就是GTO的。

但是，當前通過計算機我們看到的GTO策略是極度混合複雜的，人腦再強也無法完全做到，畢竟人腦無法遍歷所有的範圍，也不能隨機掉自己的頻率。

但GTO在撲克實戰中並不是玄學，而是具有重大意義的。

我舉兩個場景來說明：

第一個是當我們新坐下一桌的時候，面對一桌陌生的玩家，我們沒有任何對手的歷史信息的情況下。我們將努力的模仿GTO策略，來儘可能的少被剝削。我們需要一定的對手的手數來獲取其他玩家的信息，包括玩家的類型和手牌範圍的上下限。進而我們才能採取基於GTO的剝削策略獲取更大的價值。

第二，我們怎麼知道玩家漏洞究竟是什麼樣的？拋去old school定性式的描述，有沒有精確的方法來衡量？舉個例子：

在這樣一個面，我們發現對手的cbet頻率明顯高於50%，比如高達75%以上，就意味著他咋呼的過多了，我們用更多的牌去加註他，他就難以抵抗。這個例子是為了說明，GTO策略的研究，為剝削打法設立了一個標準，任何偏離GTO標準的頻率，在實戰中如果被發現，都可以針對性的調整進行剝削。

而在國外，使用piosolver來尋找並構建GTO策略和range已經是非常普遍現象了。但在中國有能力的玩家依然比較稀有。

一、什麼是GTO？

GTO（Game Theoretical Optimum），首先要了解這個辭彙，中文直譯是博弈理論最優（策略），直白點說也就是博弈論中的最優策略。那麼我們如果要了解GTO，那就必須了解博弈理論。

博弈論（Game Theory）本身是一門學科，而且是比較前沿的那種，那麼我這裡就一筆帶過，講一些最基本的原理。用一個比較簡單的定義：博弈論是二人（或者更多人）在平等的對局中各自利用對方的策略變換自己的對抗策略，達到取勝的目的。博弈論考慮遊戲中的個體的預測行為和實際行為，並研究它們的優化策略（以上沒看懂的話問題也不大）。

二、納什均衡

說到博弈論，就必須得提到納什均衡。納什均衡是這樣一種狀態：博弈中的每一方都不能通過單方面改變自己的策略來增加收益。現在一些撲克pro熱衷於討論的GTO，其實就是納什均衡的一部分。那麼除了裝逼以外，納什均衡在撲克中有什麼其他意義嗎？我們可以從兩個角度來看這個問題：

1、對手不能通過調整打法來剝削我們的EV；

2、面對對手的策略，我們做出了最優對策。

由此看來，納什均衡可以在撲克中幫助我們實現「絕對的防禦」。而其實所謂的GTO，就是求解撲克中的納什均衡解。關於如何求解納什均衡，我不在這篇文章中過多討論。目前大部分的撲克pro會藉助各類軟體來直接計算納什均衡範圍，幫助他們復盤學習。我這裡想談一下納什均衡意味著什麼。

從之前的描述其實已經可以看出，納什均衡是不能通過一個人來實現的：你可以做出納什均衡解中的你的部分的行動（通俗來講就是你是GTO的），但如果對手不按照納什均衡解來行動（通俗來講就是對手部GTO），就不能實現納什均衡。

而撲克中的納什均衡，幾乎都是混合策略納什均衡。這裡我們不深入講純策略和混合策略，大概意思就是：你拿著同一手牌，純策略是你必須100%bet或者100%check，而混合策略可以讓你bet一部分，check一部分。總之，從定義上看，混合策略納什均衡解意味著你讓對手陷入了這樣一個狀態：對手無論選擇哪一種純策略，他的EV都是相同的——當然這也意味著他無論採取什麼樣的混合策略來應對，他的EV也是相同的。

三、有關GTO的一些錯誤觀點

從上一節末的結論出發，再結合撲克是一個零和博弈（不考慮抽水），於是很多人會得出這樣一個結論：

在撲克中，如果我是GTO的，那麼不管對手是不是GTO，我都會長期保持不輸不贏的狀態。

他們還會列舉一個剪刀石頭布的遊戲來加以佐證：剪刀石頭布中，如果我分別以1/3的概率出剪刀、石頭和布，那麼無論你怎麼應對，我們長期的EV都是0（在這個例子中確實是完全正確的）。

而在撲克中，也有一些例子可以「證明」一個類似的結論：在河牌我們用2/3的nuts和1/3的bluff做一個底池的下注，此時對手的中等牌無論怎麼call，他的EV都是0，而我們的EV恆為一個底池（這也是一個完全正確的例子）

我的觀點是：在撲克中，這都是一些過於草率的錯誤結論，只有在非常嚴格的限定條件下才可能成立。

我們追根溯源，談一談納什均衡的求解：在求解納什均衡的過程中，我們必須首先剔除嚴格下策。

什麼叫嚴格下策？在撲克中，fold掉nuts，用完全空氣跟注就是明顯的嚴格下策。在剪刀石頭布當中，出剪刀、石頭、布都不是嚴格下策，因為他們總是有可能贏的。而在經典的類撲克博弈模型AKQ遊戲中，跟注Q就是嚴格下策。在撲克中，大部分情況下我們的範圍內都會存在一些嚴格下策決定。換句話說，對手的範圍完全由中等牌力構成，而你的範圍完全兩極化的範圍這個假設太過於理想化了。既然你不能保證你的對手不會做出嚴格下策的決定（類似27o call 3bet，hit or fold這樣），那麼你就不能應用所謂的EV相同法則。而顯然，採取了嚴格下策的對手會使得你的整體GTO策略自動獲利。

總之，以上結論只有在對手的策略集完全剔除了嚴格下策以後才是正確的。

原文鏈接：關於GTO的一些分享 - 撲克人

GTO肯定不是玄學，但同時覺得GTO無用也是很正常的。

首先，絕大多數玩家都是高度不平衡，極易被剝削的（包括很大部分的盈利玩家比如我），對抗這種玩家時（其實就是幾乎所有牌局中），關注點當然應該落在對手的漏洞而非自身的平衡上。

舉個栗子

「比如在單挑中，在所有AXX面上我任何2張都跟注snowie 3bet後的cbet，然後只要snowie check turn我就下注，snowie從來沒有跟注過，且其轉牌下注頻率在我看來也不夠高到來讓它以這個頻率放棄轉牌。」

這是@rt dk在描述對抗snowie時的一段話，即這裡我們發現了對手只要check turn必然是x/f的漏洞，自然的我們簡單的下注來攻擊就好了，沒有必要check behead（哪怕一次）來平衡我們在turn上的下注頻率。

換言之，我們即便自己再不平衡也要儘可能地剝削對手。比如經常能看到的一句話

「如果對手被我們n倍下注尺度的3bet時，棄牌率達到m%，那麼我們就可以用任意兩張牌去3bet他。」

換成石頭剪子布就是

「如果對手出石頭的概率最大且不會調整，我們就100%出布去剝削他-_-||」

當然，世界上還有一小撮很難剝削，相對平衡的玩家，為了贏錢的話，簡單的不跟他們玩就是了（當然也廣泛的包括不易被當前水平的自己所剝削的玩家）這種情況下，GTO也無法用來剝削這些玩家。

最後，NLHE好像暫時還沒有一個嚴格而完整的GTO策略，即便想學也沒有明確的標準，如果只是趨向於平衡，趨向於XXX，大部分玩家應該都是朝著這個方向在走，並沒有因為這個提出沒多久的概念而發生實質性的改變。

當然不是玄學，一個掌握了完美GTO的選手（當然幾乎不可能就是了），他的調整和偏離可以說是最有針對性的，最到位的。

GTO本身剝削不了人，但是可以讓你做出更精準的剝削策略決定。

博弈均衡就是大家都這麼玩的時候沒人能從偏離這個均衡獲利。問題在於大多數人都是遠離均衡策略的，這時候最有利可圖的策略肯定不是gto，學過博弈論就很容易理解