標籤:

德州撲克的技術在歷史上經歷了怎麼樣的變化?


首先謝邀,本來我其實想忽略這個邀請的,因為我這個坑感覺實在太大了。但看見了子曰發的XUEMINGNANQING老師的答案,感覺寫的非常好,並且極大地降低了回答難度(畢竟只用寫2008-2015,而本人恰恰也是2008年第一次聽說了這個遊戲)。那之後的那段本人不才,試圖續寫一下吧。希望不是狗尾續貂。

這裡必須感嘆一下,XUEMINGNANQING老師雖然一直有所耳聞,但從來沒有拜讀過他的作品,這篇文章看完,不禁佩服他在07年左右就有的深入見解,尤其是對於「所有遊戲風格的統一」的論斷。

以下是正文:

首先,所謂技術的變化,我認為,你得先知道什麼是技術,以及什麼是當前時代最前沿的技術,才能回答這個問題。可以說,這對於我這條試圖回答這個問題的魚來說,提出了一個巨大的挑戰。因此,我認為,所有站在一個局外人的角度試圖評價技術發展的努力,註定都是會失敗的,因為除非你是世界頂尖水平,否則你怎麼能評價別人的技術怎麼樣?舉個例子來說,比如對於圍棋來說,我相信對於所有非職業而言,我們認為比如李昌鎬水平,在某一時刻,在曹薰鉉之上,往往都是通過該時刻前歷史戰績的比較,這是因為我們根本不知道他們到底腦子裡在想什麼,從而壓根無從從技術層面評價。同樣地,對於德州撲克這個結果有著巨大波動的遊戲,如果不至少接近世界頂尖水平,進行所謂的評價估計只能貽笑大方,因為顯然連結果都無法成為評價的有力依據。因此,我覺得比較好的形式,更多地是從我個人出發來探討我所感受到的德州撲克技術的演變,因為讓我說評價比如durrrr,urnotindangr2,isildur1,nutsinho這些人和諸如wcg|rider, mrgr33n13, forhayley, luvthewnba這些人到底在今天差在哪,我實在是不敢說一句話。因為前述,視角非常受局限,因此肯定有很多值得商討的地方,還希望各位海涵。

個人認為,如果將德州撲克技術的演變劃分為幾個時期的話,The Mathematics of Poker (B. Chen, J. Ankenman, 2006) 的出版標誌著德州撲克進入了當代,而在此之前還都是古代。為什麼這麼說呢?因為在這本書出版之前,世界上缺乏一個理論體系來評價到底怎樣打牌是正確的這件事。舉個例子,我們翻牌前在大盲位,有20個大盲注,按鈕位加註3個大盲注,我們到底什麼牌平跟,什麼牌加註全壓?這個問題在這本書提出之前,據我所知沒有人能夠用一個理論體系來解決。大家的想法經常都是:「他肯定沒啥牌,我要ALLIN」或者「他在勾引我ALLIN,我要FOLD」。然而,這本書通過大量數學上的遊戲模型,給出了尋找解的方法,並且一下子給出了尋找最大化壓榨和所謂GTO(博弈論最優)這兩種策略的具體方法。我不是說這本書之前,沒有人想到過(或者執行過)這樣的策略,而是說在這本書之前,我們凡人缺乏系統地學習和理解德州撲克的工具,而這本書提供了這樣一個機會。

在這本書面世前的古代,毫無疑問人們都是通過一些無法量化的所謂直覺玩牌的,於是出現了很多對於風格的定義和爭執,比如什麼是TAG,LAG等等。但在這本書面世之後,由於思考問題的模型被(雖然比較粗糙)地介紹給了所有和你我一樣的凡人,德州撲克技術層面從百家爭鳴變成了一家獨大,因為再也沒有那麼多種不同的(可能正確的)風格了。

為什麼這麼說呢?你肯定會問。這其實很簡單,Mathematics of Poker的思想簡要概括,就是他提供了一個模型,當我們輸入參數(對手的範圍和傾向)之後,我們可以得到輸出(最大化壓榨範圍)。當我們不輸入參數,而是假定對手可以執行GTO策略(事實上這也是一種參數),那麼我們還是可以得到輸出(GTO範圍)。換言之,我們只要能夠對對手進行估計,那麼我們至少能夠在多項式時間下找到最優解。至於為什麼這些模型是對的?因為德州撲克相對這世界上的很多其他東西,複雜性(相對)實在是不夠高,當我們能夠從一些(雖然較多的)假設出發,利用比如CardrunnerEV這樣的軟體,完全可以簡單窮盡整個決策樹的。

但是,畢竟打牌這件事上,上面的模型有兩個問題。第一,你到底怎麼知道敵人的範圍?第二,現場怎麼可能讓你窮盡決策樹?

這裡我們引用一些統計學的概念。由於上文所述,The Mathematics of Poker證明了給定所有公開信息下,最優策略的存在性和唯一性。於是事實上我們所有人在做的,就是試圖估計這個最優策略。這個估計涉及兩部分,第一部分我們需要先估計模型的輸入參數,第二部分我們再試圖估計模型的輸出參數。但凡是估計,總會有誤差,誤差就是我們的估計與全知全能狀態下模型的輸出值的差了。於是這樣就很容易理解了,我們的確解決不了上述兩個問題,但通過努力、學習、復盤、觀察、思考、理論模型、討論、請教練、打牌、睡覺等等等等,我們可以儘可能試圖縮小誤差。誤差的存在並不能證偽模型的正確性,這就如同現代經濟學一樣,每一個偉大的模型都伴隨著無數的假設,這些假設比德州撲克里的模型還難滿足,那些模型的輸入條件比我們平時打的牌所遇到的情況更理想化,但你很難去懷疑這些模型結論的正確性和其相應的(至少是宏觀上的)價值,這也就是邏輯的價值所在了。

更何況由於上文所述,最優策略是存在且唯一的。這也導致我們對輸入參數的估計變簡單了,畢竟假設對手是一年前的你,你估計他怎麼想會很難嗎?而如果對手跟你路數完全不一樣,那他本身就已經讓渡了EV,於是你也可以接受對他估計的更大誤差了。

於是2008年之後德州撲克技術的變化,在我看來就是:

1. The Mathematics of Poker所給出的思考模型逐漸擴散

2. 使用上述思考模型的選手的估計誤差普遍逐漸縮小

3. 由於普遍水平迅速提高,導致世界級必須在細節(誤差的細小差距)上精益求精

這也直接導致了,我文章開頭所引用的XUEMINGNANQING老師所說的,「所有遊戲風格的統一」。因為事實上只有一個正確打法,就是模型所給出的數學最優,其他打法都是錯的。在這裡,所謂TAG LAG變得毫無意義,他們都是虛妄而華麗的假象,因為當時刻的最優可能要求你玩100%,也可能要求你玩5%,你必須能夠一會玩100%,一會玩5%。事實上,世界最頂尖也是這麼做的,我們可以回想,2008年左右的世界頂尖,普遍認為是durrrr,phil ivey,patrik antonius。在這之後,isildur1橫空出世擊沉durrrr,又被brian "sbrugby" townsend,cole "cts687" south以及brian "stinger88" hastings組團消滅,之後便再也沒有如同durrrr這樣風格明顯的玩家出現了。無論是後面的scott "urnotindangr2" palmer,richard "nutsinho" lyndaker,issac "luvthewnba" haxton,ben "bttech86" tollerene,ben 「sauce123" sulsky,乃至phil "OMGclayaiken" galfond,doug "wcg|rider" polk,jacob "lottenice" rasmussen和不知道真名的forhayley,你能說出來這些人風格的普遍區別所在嗎?這是因為他們的模型相同,並且差距體現在估計誤差的細小差異上,乃至在我們凡人看來,我們無法如同當時看durrrr一樣,發現他們和別人哪裡做的不一樣。但舉個例子,我問你stu ungar和johnny chan風格有什麼區別,我相信這問題看過他們資料的人根本不難回答。

在錦標賽的世界裡,也是如此,calvin "cal42688" anderson 可以在scoop里3圈不入池,也可以三圈open80%的牌,這真的是他拿到了大牌嗎?還是不同的時刻要求不同的最優策略?mtt世界裡上文所述的世界頂尖策略的接近性也同樣存在,這裡就不再列舉了。

具體來說,從我的直感來看,當代德州撲克對於前文所述的模型們的研究,正在朝著極為精密的方向發展。什麼時候應該分割範圍?什麼時候HU里 LIMP BTN?MTT里前期到底應該多少X OPEN?我們什麼FLOP CBET 2/3pot,什麼FLOP CBET 1/2pot?這些問題你可能覺得很難得到精確的答案,但事實上這些問題是有答案的,並且答案都非常精密,可能精密到涵蓋所有FLOP組合的一張大表的程度。世界頂級不是在家睡覺亦或者憑感覺打牌亦或者在網上與人進行無法量化的似是而非的感性的討論而成為世界頂級的,因為尋找答案的方向都擺明了,願不願意順著前人的足跡去試圖理解,領悟,得到可複製的結論,就看每個人自己了。

上述也就是為什麼德州撲克越來越難。現在在PS上小級別比賽,亦或者小-中級別現金,無數的REG明顯也在用類似的思想進行遊戲。這並不是說不沿著這方向努力贏不了,而是說會加大贏的困難程度,因為德州撲克畢竟存在很大的波動,並且不沿著這方面努力並不代表你不能執行一個讓渡EV並不是特別多的策略。

至於未來,個人認為發展趨勢會繼續朝著現在的方向前進。我們會越來越多地看到年輕的網路大神們,從最開始就沿著最正確的方式學習而出來收割他們努力的成果。世界最頂尖的水平會越來越高,越發地讓人高山仰止,而目前德州撲克的金字塔模型能否成立,我們這些凡人想在撲克世界裡生存能否成功,就只能看新的玩家加入的速度了。

以上純屬個人觀點。這篇文章寫了一個小時,內容也比之前預想的寫的要多。回過頭來看似乎感覺非常枯燥,這類文章按理說應該是講故事最有可讀性(我感覺知乎高贊類答案好像都是圍著題主的原問題講了一些什麼都沒說的有趣故事)。可沒辦法,筆者不才,實在是搞不太明白世界最頂尖們腦袋裡到底咋想的,因此也講不來他們的故事,只能讓各位湊合看了。。


後現代風格的翻牌前思維

作者:xuemingnanqing

(註:文章沒記錯的話應該是xue老師在07年左右寫的,之後的技術發展狀況文章中沒有提及,等其他人補充把。)

各種不同的打法風格

保守的風格:

在很多老式的教科書中,(比如,Doyle Brunson的《超級系統》),上面所推崇的打法肯定是保守型的(謹慎,理性,深思,安全,計算)。

這種風格的兩個主要特點是起手牌的限制和相對較大的下注量。保守的玩家以贏率或價值優勢為基礎來進行遊戲,他們知道位置的含義並把對策變化的因素考慮進 去,如牌桌形象和歷史牌局(心理層面)。

這種風格根源於上個世紀的50和60年代。它的可行性在於(撲克在當時主要是玩現場的: 「後院撲克」)差距理論,除牌效應和松且被動的差玩家,以及下大注施加壓力而佔據心理上的優勢。

這種風格的主要特點是:

翻牌前:

緊的加註範圍 (10-16%: 22+, A2s+, ATo+, KJ+, K9s+, Q9s+, QJo, JTs;取決於位置; 注意: 在UTG拿到AQ幾乎總是只玩同花的,理由:位置/可遊戲性)

在有利和不利位置用潛在的強牌再跟注和冷跟注(8-10%: 22-JJ, A2s-A5s, ATs, 54s-KQs, 75s-KJs)

非常緊的3-bets (2-3%: QQ+ AKo, AQs;注意:針對BU的偷盲也可以用AJs/AQo反加)

沒有4-bet詐唬(4-bet棄牌): 最小的4-bet範圍(1%: KK+; 注意: AKs要取決於牌桌形象,籌碼量和身體語言的暗示)

翻牌後:

很少看到選擇性的和視情況而定的詐唬和打法;

翻牌圈持續下注作為翻牌前主動方在轉牌圈延遲性的持續下注;

在成對牌面,小牌牌面和A加兩張小牌的牌面上,單挑情況下在不利位置觀讓/加註翻牌圈;

單挑時在有利位 置跟注翻牌圈/加註轉牌圈來float詐唬。盲注對戰中:在不利位置StopGo或在有利位置下注翻牌圈/轉牌圈;

很少用邊緣化的有價值的牌抓對手的詐唬;

用AK或AQ在帶有失敗聽牌的小牌牌面上,在翻牌圈和/或轉牌圈用弱頂對採用被動的打法之後(WAWB)

作為標準打法在幾乎所有輪次中下大注(大的價值下注);

翻牌圈下注底池的60%到95%之間;

轉牌圈和河牌圈下注底池的75%到90%之間;

保守的風格大致被界定為坦率的。強牌強玩,弱牌弱玩。很少詐唬,只是有選擇性地這麼做。作為翻牌前的主動方或者你有價值優勢,翻牌後的激進度最大限於底池大小。

現代的風格

自從大型電視轉播的出現(大約開始於90年代後期),觀眾有可能看到參賽者的底牌,普遍的風格發生改變。保守的風格由於它的可預見性而失去效益。

這導致很多玩家不是玩更多的牌就是採用不同的方式玩特定的牌或只是有時採用不同的方式。

這意味著:作為博弈論的一個絕對基礎, 「(更多)現代的」風格失去它的價值-優勢。反過來,棄牌率在另一方面獲得現實意義。為了誘騙對手,你偶爾設法隱藏(假扮)自己的牌力。

結果,現代玩家的打法更豐富,詐唬也大大提高。這產生獨特的動態性: 遊戲變得更心理化,更激進和多變。

這種風格的主要特點:

翻牌前:

松的加註範圍/高偷盲頻率(15-30%的PFR: 22+, A9s+, ATo+, K9s+, KJo+, QTs+, JTs ,作為小範圍到22+, Ax+, K9s+, KJo+, Q9s+, QTo+, J9s+, JTo, 54s+)

更高的3-bet頻率,包括在有利位置針對前面位置的加註(取決於2-bet的 PFR 2-12%:多達 22+, ATs+, AJo+, KJs+, KQo, QJs, JTs)為獲得價值,主動權和棄牌率

選擇性的4-bet-詐唬,取決於籌碼量(從有效的120BB起)和棄牌率(經常在UTG針對後面位置的3-bet進行[最小-]4-bet以及在 BU/CO針對盲注位的3-bet)

作為3-Bet特殊形式的壓迫打法(squeeze),由於它有更高的棄牌率(取決於位置和玩 家的跟注傾向,多達16%: 22+, A2s+, ATo+, K9s+, KJo+, QJs)

翻牌後:

在翻牌圈和河牌圈有更高的激進度;

在2-bet/未加註的底池中進行價值性性觀讓-加註和詐唬性 觀讓-加註;

在3-bet底池中為引誘加註而進行反主動下注;

在轉牌圈,河牌圈進行詐唬性下注,在不利位置 和有利位置利用危險牌下注詐唬;

在不利位置float詐唬(通常是深度籌碼: 150BB+);

3-barrel詐唬或詐唬性下注方式(跟注翻牌圈, 下注/加註轉牌圈,下注/加註河牌圈; 觀讓-加註翻牌圈, 下注轉牌圈, 下注河牌圈)

下注量的變化:

不利位置在每個輪次的阻攔下注(底池的20-40%),在轉牌圈(底池的55%-95%)和河牌圈(底池的30%-95%)的價值下注;

作為詐唬和價值下注而在轉牌圈和河牌圈超額下注(通常在不利位置全押)

兩種風格優缺點的比較

現代風格的主要優點是它的不可預知性(偽裝,欺騙)。Sklansky在《撲克的基本原理》中說,當對手採用他不知道你有什麼牌的打法時,你總是獲利。這 里也適用於這一條。因此,下注方式和下注量的變化在於引起對手作出錯誤的決定。

缺點是你的牌比對手的範圍差,你經常帶著這種牌進入翻牌圈甚至玩到攤牌-換句話說,你在劣勢下把錢投入。簡而言之: 你偏離最佳的遊戲方式(最優化的遊戲理論)來讓對手做同樣的事情。你利用對手也會被對手利用。

現代風格的更深一層含義是,你在加劇波動的同時也讓你利用邊緣化的優勢而成為你的有利因素。例如,保守的玩家在BU面對MP的加註會放棄KJs,而現代的玩家通過考慮提高的波動性和翻牌後的錯誤代價有時贏得幾個底池,如果對手沒有調整他的打法(或者有調整,但不及時)。

現代風格的可行性還有一個原因,它給對手製造困難的決定,給他心理壓力並讓他犯錯。即,在某個關頭的昂貴決定。因此,它不僅僅是按概率獲勝的問題。

無限注遊戲很重要的一點是靠潛在成敗比生存: 現代玩家比保守玩家佔有的優勢在於他處理這種情況的經驗。因此,我們推斷:有經驗的現代玩家將在翻牌後比保守的玩家犯更少的錯誤。 從進化的角度看撲克 – 後現代遊戲的理解基礎

鯊魚餓了!

這是Humberto Brenes的標誌性口頭禪, 他在WSOP的牌桌上帶著一個小鯊魚樣式的壓牌器。這條鯊魚的形象可愛逗人,但它代表撲克王國中的一條基本真理,這讓我們更加深入地給我們這一代的社會文 化作出思考。

實際上: 殺戮與被殺戮,鯊魚吃傻魚,這在撲克的世界裡是合情合理的。當今的撲克玩家希望到撲克學校去學習,即學習掌握遊戲,他們為生存而持續戰鬥。用術語說就是: 你自己資金的保護或增長。

在你的住處和牌桌上,還有玩家希望能生存下來;他們是對你和資金的威脅。你們都生活在一個有限生命力的世界上。用撲克術語說: 傭金靠你來提供。每次戰鬥都會耗費能量。

你現在可以為戰鬥而準備: 一方面,通過理論上的訓練(數學分析知識,比如一覽表) 和精神上的準備(心理, 穩定性,抗壓性);另一方面,通過回顧前面的戰鬥(場次回顧/牌局回顧和分析)。

作為一個撲克玩家,你有決定的自由,只限於牌桌級別和你的有效籌碼量。你有多個來源作為決定的基礎:偶然性, 情緒,計算/評估。雖然有些玩家用翻硬幣作為決定的基礎,但計算顯然給你最大的生存機會。計算的最重要資源是信息。

這是思考型玩家的世界

你有兩大塊信息來源: 遊戲理論,即德州撲克的數學分析基礎和對玩家的分析。

你開始對對面的玩家毫不了解。除了他的籌碼量和網上名稱,你一無所知。你無法看穿他的決定。它在理論上甚至會是一台隨機遊戲或很系統化的電腦,即程序化。

為了根據盡量完整的信息作出明智的決定,你需要假設對手也是一個理性的思考型玩家。這意味著他的決定是根據可以理解的和幾乎透明的理由。

除了這一點,你需要知道對手從博弈論的角度可能沒有作出最好的決定以及不是每個人都按照同樣的方式遊戲:每個玩家有自己的遊戲邏輯並以自己獨特的方式證明自己的打法是正確的。這可能符合最佳的遊戲理論,但也不一定。為了利用信息來對付他,你要學會理解他的決定,這一點因此很重要。

撲克的進化:從跟注站到LAG-TAG

撲克的世界裡存在不斷進化的系統:想生存的玩家需要進行適應調整。沒有活下來的玩家可能(破產/降級)

在進化論中,我們談到物種多樣性的原則。大自然選擇這些不同的物種生存下來,這被稱為自然選擇。最終,持續的選擇造成穩定的狀態。

如果你把這個理論用於撲克的進化,你就能得出一條可行的結論: 它從一副牌和遊戲規則開始。幾個玩家除了規則外對遊戲知之甚少,這建立了變化的基礎。因此,每個玩家都是撲克世界中的一個變數。一些玩家賺錢,而另外一些 虧錢。

較好的玩家將被選擇並繼續生存。撲克中的特殊環境(即運氣,波動)類似於自然界的隨機現象。但在現實中,較好的(更精通的)玩家會長期生存,他們是這個世 界中的穩定因素。

在撲克中,會思考的人類相互競爭,同時他們根據理性的決定來相互衡量對方(上面顯示的那樣)。能作出較好決定的玩家將名列前茅。自上世紀50年代起從博弈 論的角度,撲克發生了很多變化,很多玩家都可以獲得撲克的這種技術性知識,這要歸功於電視和網路,特別是撲克學校。

這是一種發展和進步,它來自進化論的角度:

在跟注站的世界中,緊凶玩家(TAGs)被選擇,因為他們賺的錢比虧的錢多,這是由於價值-優勢 (「保守時代」: 大約1950-1990).

在TAGs和跟注站的世界中,LAGs(松凶玩家)和TAGs被選擇。TAGs針對跟注站具有價值-優勢,而針對LAGs具有較小的價值-優勢(帶有高波動性)。LAGs針對跟注站具有價值-優勢和欺騙-優勢,針對TAGs具有帶高波動性的欺騙-優勢(「近現代」: 大約1990-2003)。

在TAGs, LAGs和跟注站的世界中,第一個選擇對象落到能利用LAG和TAG優勢的玩家(LAG-TAG),第二個選擇對象落到能利用某些優勢的玩家(「後現代 派」)。

後現代遊戲的重要方面–知道你的敵人

知識的力量

後現代主義玩家的特點之一是他們知道自己的長處和短處以及對待遊戲的思維模式。你要明確自己處在競爭的努力中。你有一個目標: 盡量保全資金並提高它。你有充足的信息來達到這一點。

因此,一方面,學習遊戲理論對你來說是最重要的(通過閱讀其它的策文章,觀看視頻,分析牌局);另一方面,你要在牌桌上獲得經驗,以至於你在處理牌局上變 得更加熟練,即對信息的評估。

關鍵是,你要知道採取特定行動的理由和意圖並知道你有哪些優勢。

收集和處理特定對手的信息

你知道對手處在撲克進化階梯的不同階段。這意味著他們的打法包括pre-conservative派(水平差的跟注站),保守派(TAG), 現代派(LAG)或後現代派(LAG-TAG)。各種對玩家類型的描述能幫助你利用對手的弱點,例如,驢子,岩石和瘋子。

在線上撲克中,你應該記錄對手可以利用的風格和傾向,並且通常帶著數據遊戲,這讓你更容易知道遊戲的概況。如果你永遠標記一個玩家很差,這會很危險: 玩家也在學習新的東西!

進化不是靜態的過程,它漸漸地改變。大致描述的風格與差的玩家有關聯,他們不是有意識地採用任何特定的風格,因為他們經常憑膽量作決定。因此,你永遠不要 100%地依賴數據和記錄,而要精確地評估獲勝/失敗的風險,只要你獲得信息。

尋找對手的漏洞

一旦你給對手完整的評價(有意義的樣牌數量: 幾千手牌),你將能正確地根據他的風格來給他分類並判斷他的一系列打法。你知道你在特定的情況下是否可以3-bet,何時冷跟注更好,何時4-bet是無 利可圖的,何時採用詐唬性4-bet是可行的,等等……

從更廣的意義來說,知道各種風格的優缺點並利用對手的漏洞是作為後現代主義玩家的優勢: 他不是太頻繁地棄牌就是太頻繁地跟注。他可能還太激進。

數學 vs. 欺騙

你在撲克中最大的兩種武器是數學和欺騙,數學是用成敗比/傾向/數據/頻率的形式表現出來,欺騙就是針對牌力的信息優勢。由於潛在成敗比和能讓對手犯更多 潛在的錯誤,欺騙在對付保守玩家時體現出價值。對付現代的玩家,價值基礎獲得重要性。

在這一點上,你決策的能力變得相關聯。撲克遊戲中有很多後現代玩家。慎重地利用你的激進度是很重要的。特別在翻牌前的打法中,你會發現很大的潛在錯誤,特 別在巨大的4-bet底池中拿到邊緣牌時(JJ, QQ,AQ)。你最好通常用這些牌控制底池.在任何比賽中,你對付後現代派很少有任何優勢.因此,你對付他們時要謹慎從事並依靠贏率來玩大的底池。

考慮到翻牌前的複雜性和對手的多樣化(對手的類型),你需要不斷地權衡哪個因素更重要: 價值還是欺騙。如果你和同樣的對手玩了幾千手牌,你還需要評估對手針對你的打法有多大程度的調整。這通常不是通過數據來判斷,更多是通過對手玩一兩手牌的 不同方式。

翻牌前,你特別要觀察3-bet的行為和冷跟注的傾向以及特殊的打法。比如,在UTG面對BU的3-bet用AA跟注。

改變風格,混合牌型和激進度的上下調整(強勢撲克 vs. 小球撲克)變得更重要,特別當你總是與同樣的玩家遊戲時: 基本擺脫你慣常的風格,下注方式和下注大小,讓對手無法解讀和預測你。

創造性和讀牌:天才因素

作為後現代主義玩家,你結合各種不同風格的優勢。你的最大技能是計算對手的範圍並確定可行的價值下注或詐唬性下注以及利用對手的漏洞和傾向。

從後現代主義的角度來看,最佳打法的信息基礎不總是有明確的定義,你不是總能在目前的牌局中明確地定義它。人類的計算能力有時不知所措。因此,進化選擇機 制也適用於天才的不規則分布,計算能力,調整速度,發現漏洞的創造性以及對有利可圖情況的識別。

因此,你需要有很多耐心,經驗,不斷分析和處理信息的意願。不過,這些只是成功撲克玩家思維模式的一部分。

由於各種原因,這篇文章不可能涵蓋後現代風格的更多具體細節,甚至幾乎不足以作為整個框架。

下面的內容可以作為定義性的特點: 所有遊戲風格的統一,目標直指對手的漏洞。你可以參考Hasenbraten的文章(目前只有德文)來深入了解翻牌前的打法。為了獲得作正確決定的傾向,你將學習如何問自己正確的問題。

總結

從進化的角度來看,你發現自己處於與對手的戰鬥中。對手用完全個人的方式理性地遊戲。通過收集有關數學和對手打法的信息,你能識別對手的打法並利用他們的 弱點。

當你評估對手時,撲克玩家進化的四步模式幫助你解決這個問題(跟注站,保守的TAG,現代的LAG,後現代的TAG-LAG)。為了不斷地改變打法來利用對手的弱點,你通過做筆記/解 讀和數學數據能夠調整對對手的看法。

對手的打法越現代,你對贏率的依靠就越重要。對手越保守,欺騙就越重要。但由於沒有玩家採用純粹和理想化的打法,你需要把兩個元素結合起來並根據對手判斷 哪個元素更加重要。

對於特殊的情況,你與一個對手經常遊戲,他也有很多有關你的信息,這時你需要偶爾擺脫慣常的遊戲模式並不斷換檔調整,這樣讓對手捉摸不透你。

重要的是你要盡量收集有關遊戲的信息。這篇文章從後現代的角度向你說明如何做到。現在,發展這種意識由你來決定。


rt dk兄和子曰兄談到的都是高手級別的德州撲克技術演變。我的水平是在太低,不敢暢言這些,就談談作為低級別娛樂玩家的直觀感受。(對的,我就是魚玩家)

越來越難玩了。

在幾年前的時候,線上低級別只要嚴格按照緊凶打法,總會有源源不斷的娛樂玩家拿著一張A一路call到底,面對開多桌的grinder,稍微平衡一下手裡的範圍,偷偷盲注什麼的他們也不會在乎。真正打的好的玩家很快就靠著技術的進步和資金的積累進級去了。

然而,這幾年網路中德州撲克技術的普及速度越來越快,雖然可能也吸引力大量的娛樂玩家進來,但是我感覺他們的學習速度明顯比以前會快很多。正如rt dk所云,正確的打法其實只有一種,而且從學會到掌握,如果真的用心投入的話,確實並不要花上很多時間(這裡指低級別現金局,面對的都是普通玩家)。現在線上的grinder感覺明顯比以前要多,而且打法也越來越完善,就連看起來普普通通的一個小號,都有可能挖下一個漂亮的大坑等著你跳。在幾年前,別說別開多桌的玩家算計,我寧願和他們一桌。現在他們也是我的重要對手了。

對了,說了這麼多,只能說明我打了這麼多年一點進步都沒有,一直就在低級別晃悠。沒辦法,我就是這麼沒志氣的傢伙,在NL2上打光一條魚的全部籌碼,比我在NL100上和別人鬥智斗勇贏下大鍋,感覺還要好玩的多~~


之前的答案將歷史說的很詳細了,這裡我就講講德州撲克最近的發展和未來吧。

今年年初University of Alberta的CPRG小組發了篇paper(Heads-up limit hold』em poker is solved), 給出了兩人德州撲克的近似最優解。德州撲克以後可能是又一個人類最強的大師無法打敗計算機的遊戲了。

這是博弈論發展的一個重要里程碑。之前計算機可以通過暴力演算法在國際象棋等遊戲里擊敗人類,但是對於德州撲克這種不完全信息的概率遊戲(incomplete information probabilistic game)卻往往無能為力。德州撲克的可能性太多了,很難窮舉。而U of A 在過去十年里開發並完善了一套很巧妙的演算法,在有限時間裡找到了一個德州撲克的近似最優解。

要理解德州撲克的最優解法,我們先考慮一個非常簡單但又和德州撲克在理論上非常相似的遊戲:石頭剪子布。石頭剪子布有很多種策略,比如我可以觀察對手出的概率:一個人可能出剪子的概率大一點,那麼我就多出石頭(frequentist approach)。或者,我觀測到對手出完剪子之後再出剪子的概率略大於1/3,那麼我在這種情況下可以出石頭(baysian approach)。類似的策略可以有很多,也可以做得很複雜 (比如加入Kalman filter, Markov model等等)。

有人會說,石頭剪子布哪兒有這麼複雜,我隨便出不就好了?的確如此,如果你能以均等幾率出(事實上人類做到這一點並不容易),那麼沒有策略能贏你(當然你也贏不了別人)。

事實上,以均等幾率出是石頭剪子布的納什均衡策略(在此向john nash致敬)。可以證明,在兩人零和遊戲中,如果一方採用納什均衡策略,對於一個非常聰明的對手,沒有策略可以比納什策略更好。舉個例子,加入你觀察到我出剪子的概率略大而確定出石頭,作為一個聰明的玩家我可以不再出剪子而出布,我也可以誤導你我喜歡出布然後有開始出石頭。但是,如果你隨機出,我理論上無法取勝。

在過去,德州撲克的發展很像石頭剪子布,我們設計了大量策略,但這些策略都不是無懈可擊的。那麼,德州撲克存在一個像是石頭剪子布中隨便出的最優解嗎(這裡最優不代表賺最多的錢,而是面對最強大的對手也不會輸)?答案是肯定的。更關鍵的是,德州撲克是一個更複雜的遊戲,如果一方使用納什均衡策略,那麼他/她不但不會輸,而且很有可能贏一點(而不像石頭剪子布的納什均衡解不輸不贏)。

那麼這樣一個解是什麼樣的呢?其實它長得很暴力。我們需要描述每一種情況我們做每個反應的概率。比如我開局拿KK,那麼我要有80% raise, 20% bet。如果我raise對方re-raise, 我有50%check,50% fold等等。我們不需要考慮對方的策略是什麼,只需要對對方每個可能的行為給出一組概率就好。

可以想像,要想找到這麼一個解是十分困難的。U of A的撲克小組提出了一種叫counter-factual regret minimization的方法。簡單的說,就是做兩個程序對打,開始它們的概率都是隨機的,但是當一個程序採取的某個行為帶來正/負收益時,程序就調高/低這個行為的概率。兩個程序玩了足夠久之後奇蹟就發生了,它們找到了一組非常接近最優解的策略。

這個解有多接近最優呢?每一盤輸贏預期收益和最優解差不超過千分之一的blind,這足以打敗任何人類玩家了。

也許我們離被計算機統治又近了一步。


推薦閱讀:

能否分享一下你至目前的德州撲克生涯?
如何優雅的洗牌?
參加線下德州撲克大賽是種怎樣的體驗?

TAG:德州撲克 |