想問一下有沒有人能解釋一下德州撲克中的GTO策略具體是怎麼執行的?
想問一下有沒有人能解釋一下德州撲克中的GTO策略具體是怎麼執行的?能不能舉兩個栗子。翻了一圈都只看到了形而上的討論。
我舉個例子吧. 就說均衡. 目前來說GTO推導基本都是river反推.
翻前Hero HJ open (16%), V btn call. flop, turn Hero c-bet 兩槍, 對手跟注.
假設board=Jh7d6d JcJs.
假設這個牌面估計Hero c-bet所有的Jx兩槍.
這裡Hero持有的nuts數=AdJd, KdJd, QdJd, JdTd, Jd9d (0.64), KJo=3, QJo=3 (0.43). 共計=4+0.64+3+3*0.43=8.93 取9個.
這裡持有4條是絕對的nuts, 這裡我們的頂端range有起碼9個.
假如Hero下注一個pot, 應該混合4.5個combo (至少) 來實現均衡. 即在river range中選取最弱的4.5個combos 在river進行pot-size 咋呼.
QdTd, Qd9d (0.43),Td9d (0.64), Kd9d, KdTd, KdQd (0.32) 共計4.5個.
根據GTO, Hero 如果以2:1 value:bluff的頻率在river下注, 其結果是:
Hero bet, V 100% call EV=(9/13.5)*(2)+(4.5/13.5)*(-1)=1
Hero bet, V 0% call EV=1.
這裡Hero實現了均衡, 無論對手call還是fold, 我們的EV都不會降低或者提升, 都是1.
對手呢?
如果Hero在river上pot size bet的range是平衡的, 那麼
V call EV=(9/13.5)*(-1)+(4.5/13.5)*(2)=0
V fold EV=0
因為是0和遊戲, 在Hero使用了完美均衡的range之後, V的EV永遠等於0, 對手無論call 還是fold, 對手的EV都不會降低或者提升, 都是0.
這裡就看出了均衡的本質, 就是當Hero使用了均衡的range之後, 實現了對手無法通過改變決策而改變雙方EV的局面. 我們不僅自己均衡了, 對手也均衡了.
當我們實現均衡, 即使對手偏離, 我們的EV也不會增加.
理解這個概念很重要. 就是我們在river使用一個均衡的range去做下注, 無論對手call還是fold, 我們的EV不會降低也不會提升. 比如我們river 用2:1 value: bluff的頻率在river做pot size下注, 即使對手偏離到100%call 或者100%fold, 我們的EV仍然不變.
李思曉:想問一下有沒有人能解釋一下德州撲克中的GTO策略具體是怎麼執行的?
GTO的實戰意義在於:1. GTO是衡量一個玩家在不知道對手信息時,玩法正確與否的標杆。2. 使用GTO策略可以有效的防止自己損失EV。3. 如果對手不使用GTO策略,意味著對手出現漏洞,從而給我們剝削的可能。
根據GTO, vs一個 pot size river下注, 對手應該用緊縮range防禦50%, 即 call 50%. 上面敘述的例子假設btn 在river沒有任何的Jx, 只有TT998855的時候, 他call或者fold應該靠看手錶或者拋硬幣來決定. 假設他call 100% 或者fold 100%, 都是偏離GTO了.
這個時候Hero自己需要偏離GTO來實現更高的EV. 假設對手偏離而自己仍然GTO, 你的EV不是最高的 (EV=1 pot).
比如對手偏離是100% call. Hero的最優策略=
最大化剝削策略是永遠bet Jx, 放棄咋呼.
那麼bet的EV=2. 相對EV=(9/13.5)*(2)+(4.5/13.5)*(0)=1.3333333333333333
對手100% call的EV=-1, 相對EV=(9/13.5)*(-1)+(4.5/13.5)*(1)=-0.3333333333333333
那麼我們說的GTO有什麼作用呢?
假如我們知道對手的策略, 而我們的river的range只有9個nuts和4.5個air.
1.對手100% call. 我們應該100% bet nuts x-f air. EV=1.333
2.對手100% fold, 我們EV=1, 為了最大化剝削對手, 我們在turn上應該bet更多的air, 這樣在river可以咋呼更多.
3.對手告訴我們他call與不call的頻率是通過拋硬幣決定的, 那麼我們則只能通過bluff : value 1:2的頻率實現EV=1 pot. 如果你咋呼過多或者過少EV只能更低, 你自己算下就知道了.
如上, 實際上我們是需要通過了解GTO, 然後看對手是否偏離, 哪裡偏離, 偏離了多少然後進行剝削才實現最大化剝削對手.
如果對手執著的call 100%, 我們為何要犧牲0.33 pot的EV去咋呼呢? 直接100% value就可以獲得最大的EV了.
GTO, 如果理解成最優策略的話, 是動態的. 如上, 實際上我們是需要通過了解GTO, 然後看對手是否偏離, 哪裡偏離, 偏離了多少然後進行剝削才實現最大化剝削對手.
如果對手執著的call 100%, 我們為何要犧牲0.33 pot的EV去咋呼呢? 直接100% value就可以獲得最大的EV了. 如果vs一個unknow, 執行GTO可以保證不被剝削, 但是無論對手偏離到什麼程度, 我們獲得的EV是一樣的 (這裡EV一樣不等於GTO無法盈利, 在100的pot里用2:1 value bluff 比下注100我們的EV=100, 我們仍然盈利, 只是對手無論call或者fold我們的EV都不變而已). vs 一個有信息的玩家, 我們還是要根據對手的偏離漏洞去攻擊, 同時調整自己是否偏離過多而暴露出過多的漏洞而被對手共計.
比如 1020 (5) ante 9人桌. 有效3000.
翻前Hero HJ AA 83 open, V btn call. pot=83+83+20+10+9*5=241
flop=Jh7d6d Hero c-bet 200, 對手x-r 700.Hero?
根據GTO公式.
GTO simplified (OTR)
V Minimum Fold Equity to Bluff=700/(200+241+700)=0.613
Hero Minimum Defense Frequency=1-0.613=0.387
Hero co range 16%, 設cbet 頻率60%, 需要defend 0.387*0.6*192=44.6取45個combo.
JJ-77-66, AAKKQQ=25. AA是一定需要defend.
假設對手range是不平衡的, 這裡的range只有set 兩隊, 無任何的Jx, 無任何的draw, 在有這樣的信息的情況下, AA的最優策略是什麼? 棄牌就可.
即對手偏離我們也偏離, 對手不偏離我們只能GTO.
還有人類玩家肯定不能實現完美GTO的.
李思曉:想問一下有沒有人能解釋一下德州撲克中的GTO策略具體是怎麼執行的?
然而,人類玩家是永遠不可能做到完美的執行GTO策略,這是因為:1. GTO策略樹極端的複雜,人腦無法遍歷這麼複雜的策略樹。2. 人腦無法很好的在混合策略時隨機自己的頻率,從而達到完美的平衡。
不知道是否理解有誤, 歡迎反對.
PS: 我要給題主普及下什麼叫形而上, 感覺你有點瞧不起形而上. 直接給你維基百科.
Metaphysics is a branch of philosophy exploring the fundamental questions, including the nature of concepts like being, existence, and reality.[1]Traditional metaphysics seeks to answer, in a "suitably abstract and fully general manner", the questions:[2]
What is there?And what is it like?在西方,形而上學共有三個傳統分支:本體論——研究存在的問題。自然神學——研究神或眾神及關於神的問題。普遍科學(哲學邏輯)——研究第一原則,當中引發其他的詢問。例如:非矛盾定律。在特定的範疇下,一個客體不能同時存在又不存在。
從哲學角度來看, 要研究一個問題, 弄清楚這個東西是什麼, 是非常重要的. 形而上學的討論是很有價值的. 連GTO是啥都沒搞清楚, 就討論GTO具體怎麼執行是不現實的.
謝邀。
題主問的是GTO怎樣執行,那麼其原理就不詳細講了,反正百度上一搜一大堆。
原理是死的,應用是活的,我只能談談基於我理解的GTO怎麼實戰。
簡言之,它是建立在底池賠率基礎上的範圍攻防,要求每個跟注範圍在支付對手價值範圍的同時恰好抵消掉對手的詐唬權益。
個人認為把GTO執行到接近完美不太現實。一是完美GTO不是人類能學習並應用的。二是在線上多桌的打牌環境下撐不住。
但是它有兩個總體特徵:
1.我們感覺很大的牌力範圍變動,體現在GTO要求的最優頻率/BET SIZE上,影響是很小的。比如某些常見牌面,把某項動作的範圍從TPTP擴大到TPWK,或者從聽花+兩頭順擴大到卡順+後門堅果聽花,可能影響到的頻率只有百分之幾,例如從66%-70%這樣。(久別牌桌,無法拿出具體實例了,以上所言只是根據回憶)
2.GTO從原理上要求主動動作的範圍(下注/加註)總是極化,跟注的範圍總是緊縮。給我在決定採用哪種動作(B/C/R/F)時,提供了一個新的出發點去思考,說的通俗講就是平衡範圍,在詐唬下注時考慮的不是「讀XX玩家沒有牌」而是「此時HERO的下注範圍會足夠強,因為有太多價值牌在保護詐唬牌」。同理,價值下注時考慮的不是「讀XX有個頂對/超對會支付」而是「這裡如果不詐唬會check back fold太多空氣牌丟死錢,所以需要把強牌放在這裡打價值」。(如果能翻到我以前在知乎答的牌局問題,題主或許能有所理解)
基於此,我個人的方法是:1.簡化。2.熟悉常見情況的模型。
關於第一點:私底下討論牌和打牌最大的不同在於,前者是單線程長時間的思考,後者是多線程短時間的思考。牌桌下可以耐心研究最優解,但牌桌上只有5-10秒的時間可供決策,並且要同時兼顧4-8張牌桌。如果不做簡化去算範圍,以我淺見覺得很難做到。
關於第二點:其實大致相當於第一點的延伸,對於常見的情況可以自己在牌桌下模擬,得到大致的應對範圍後,在桌子上再根據位置和BET SIZE微調。可以先從模擬翻前34B-range,翻後的單/雙高面,小牌/連牌面下單挑/多路/有沒有位置,之類的情況逐步展開。
GTO有絕對正確,但上述如何應用純屬曾經的個人方法。已經很久沒打牌了,不知道是否落後太多,歡迎實名反對。謝邀,這段時間一直在忙比賽,才看到這麼多邀請的問題,我會盡自己能力給大家一些討論。
GTO的實戰意義在於:
- GTO是衡量一個玩家在不知道對手信息時,玩法正確與否的標杆。
- 使用GTO策略可以有效的防止自己損失EV。
- 如果對手不使用GTO策略,意味著對手出現漏洞,從而給我們剝削的可能。
然而,人類玩家是永遠不可能做到完美的執行GTO策略,這是因為:
- GTO策略樹極端的複雜,人腦無法遍歷這麼複雜的策略樹。
- 人腦無法很好的在混合策略時隨機自己的頻率,從而達到完美的平衡。
人更多是用固定的尺度來化簡實際的GTO策略,使自己能夠更容易的記憶這些策略。與此同時,減少自己的EV損失。通常,我們會有 25%,33%,50%,100%,200%等下注尺度,然後帶入到軟體計算,通過軟體模擬出一個接近的頻率,並對這個頻率進行記憶。在遇到相似的情形是,我們就執行軟體跑出來的結果。這就是作為人類玩家如何模仿執行GTO策略了。
翻了一圈都只看到了形而上的討論。
原因很簡單,根據我跟一些有 10 年經驗的,包括一些具備名氣的實戰牌鯊魚的溝通。基本大家還是在打剝削策略,這類策略沒有人講得清楚也沒有人會在實戰中用。
而我上面提到的這些鯊魚不同點在於,他們的剝削策略已經用得很熟練了,以至於他們不需要假裝懂 GTO。
感謝邀請。近期德研社剛邀請一位職業牌手做了GTO分享課,他是GTO的專家,邀請了他來為您的問題做下解答。
GTO會給出在任意一個情況下的一個最佳打法的動作。
比如你是KJ做了open 大盲call你,flopK85r,對方check,到你,你是bet還是check?
又比如你是AA,有人open,你3bet,flop KJTr check check, turn 對手打半pot,到你,你這時的最佳動作是什麼?
GTO打法的目的一是通過自身的一個範圍上的平衡使對手很難針對我們的動作,同時反過來通過我們對GTO(最優打法)的了解,發現對手打牌中的漏洞並予以攻擊以達到盈利最大化的目標。
——————————————————————————
因為你沒有具體的牌局,很難說清道明GTO是怎麼運用的,只能基於你的問題,回答GTO的概念是什麼。
想要進一步學習GTO,可以來德研社和我們一起交流哦~
舉一個Ben sulsky視頻里的例子:6max遊戲,Hjack open,BTN solid玩家call,flop J35o,這個flop Hjack玩家的策略是什麼?可能差一點的玩家cbet所以的所有的J+,chk call中等牌力的牌,chK flop所有的空氣,好一點的玩家chk一些強牌如AA/JJ/Jx平衡chk 範圍,bet其它強牌和空氣,用一種相對極化的策略。可用solver模擬這種情形後發現:這牌面ev更傾向於BTN,hjack cbet頻率應該非常非常低,如果cbet過多,哪怕cbet 範圍設計的再平衡,也無法彌補chk範圍太弱損失的ev,BTN可以用自己在這個牌面上本就很強的範圍對hjack的羸弱的chk範圍進行極大的剝削。所以這個牌面最接近GTO又容易操作的 flop策略是什麼?Hjack chk全部範圍。這是現在最普遍最簡單的去發覺漏洞尋找GTO策略的方法,很多國外線上中級別reg甚至低級別reg都在做的事情
推薦閱讀:
※討論今晚cash局的一手愚call...?
※德州撲克口袋對如何玩成正EV?
※能不能解釋,或者列舉一下德州撲克常用的術語?
※如何介紹德州撲克的規則和流程?
TAG:德州撲克 |