撲克中的數學59:半街遊戲
《The Mathematics of Poker》中文翻譯
感謝梅有錢(梅老闆)的合作翻譯(這一篇都是他翻的!)
半條街:半街遊戲
在開始研究撲克的玩具遊戲時,我們先考慮一個簡化的系列遊戲:半街遊戲。半街遊戲具有如下特性:
· 第一個玩家(通常我們稱X)一般都是過牌
· 第二個玩家(通常我們稱Y)可以選擇過牌,或者下注一定量依據遊戲規則
· 如果Y下注,X總是選擇跟注攤牌或者棄牌(不能加註);而當Y過牌,那麼X也過牌並且攤牌
我們這裡會提到遊戲的價值。這裡就是假設雙方都最優的時候,玩家Y的期望。我們只會考慮因為下注而產生流動的錢。這個價值就是攤牌前的價值。這裡包括了X下注,Y跟注或者X成功詐唬而產生的盈利。
我們在研究這些遊戲時,使用攤牌前價值,是因為我們不是特別在意遊戲開始之前玩家動作的價值。我們試圖尋求半街遊戲里下注的價值。底池大小是5,10還是18並不重要,除非它與遊戲里的動作有關。同時我們也注意到Y是不會有負期望的,因為他可以在後位過牌來實現0期望。
半街玩具遊戲有至少一個非常重要的價值:我們可以解決它——實際上,我們可以解決任何半街遊戲,只要他的複雜程度還可以。之後我們會看到,多條街的遊戲經常會非常棘手,我們只能得到近似結果。而解決一些遊戲是非常有價值的,因為我們可以用這些結論去理解一些更複雜的遊戲。
我們要討論的第一個遊戲非常簡單,它包含一個貫穿第三部分的概念——先知,玩家如果知道對手的牌,而不知道要發什麼牌,那麼他被認為是半先知;而如果他們既知道對手的牌,也知道要發什麼牌,那麼他們就是先知。這裡因為沒有牌要發,所以兩個概念都適用。
牌例 11.1 –先知遊戲
1.5條街
底池下注P
限注下注
Y是先知
Y的手牌是隨機抽取的,其中一半可以贏X另外一半輸。
在這個遊戲里,X和Y都只需要做一個決定。這是大多數半街限注遊戲的相似點。Y必須決定一個下注的範圍,而X必須決定一個跟注的範圍。X這個遊戲里的「範圍」包括了所有一樣的牌,因為他只有一手牌可供選擇。但是這並不是問題,下注和跟注的範圍既可以包含特定手牌的混合策略也可以是單純策略。
我們立刻就能發現Y在這個遊戲里有信息優勢;他可以用完美的比例價值下注所有能贏的牌(我們稱之為堅果)並且詐唬一些會輸的牌(我們稱之為空氣)。
這個遊戲攤牌前的收益矩陣如下:
為了找出這個遊戲的最優策略,我們需要牢記上一章里的一些原則。首先,我們考慮單純策略,假設Y價值下注所有的強牌,過牌其他的。那麼X就可以通過始終棄牌來剝削他。而一旦X這麼做了,Y就可以調整成下注所有的牌(價值下注和詐唬)。而Y一旦這麼調整,X也會變成永遠跟注。所以Y可以通過下注所有價值牌和過牌一些弱牌來剝削他。
我們又得到了這個熟悉的搖擺單純策略;這也意味著最優策略會是一個混合策略。這裡有兩個策略選項——一個對於X(用什麼頻率跟注Y),另一個是Y的(用什麼頻率詐唬)。Y需要永遠價值下注堅果牌,因為這個選項主導過牌。X會跟注一定比例的牌,我們稱之為c。類似地,Y會詐唬的比例我們稱之為b。一旦我們找到b和c的值,也就找到了這個遊戲的最佳策略。
我們輪流考慮這些決定。
首先,我們考慮X的跟注頻率。當X使用最優策略時,會讓Y的詐唬無差別(也就是說,Y弱牌的過牌與下注期望相等)。當詐唬的時候,Y如果成功則贏下底池p(如果X棄牌),如果失敗則損失1(如果X跟注)。那麼c這裡就是跟注頻率,而1-c就是X棄牌的頻率,所以:
(底池大小)×(X棄牌頻率)=(詐唬下注)×(X跟注頻率)
P(1-c)= c
C = P/(P+1)
注意到隨著底池大小的增長,跟注頻率也增長。這也是一定意義上底池賠率的延伸,底池越大,X需要跟注的比例也在增加,從而阻止Y詐唬。
而對於Y而言,類似地,必須詐唬足夠的頻率而讓X跟注和棄牌無差別。當跟注的時候,X損失1如果Y是價值下注,贏得P+1如果跟注了對手詐唬。假設b是詐唬頻率,那麼:
1 = ( P + 1 ) b
B = 1 / ( P + 1 )
%% P112結束
這個1/(P+1)是一個在分析撲克里是非常重要的值。重要到我們需要賦予它一個希臘字母α(alpha)。
α= 1 / ( P + 1 )(限注情況)
α這裡代表兩件事。首先X必須跟注足夠頻率從而讓Y的詐唬和過牌無差別。X的跟注頻率就是P/(P+1),或者1-α。因此α就是X當面對Y下注時的棄牌頻率。另外,Y用α的頻率詐唬,因為他會用100%的價值範圍下注,所以α等於詐唬與價值之比,從而讓對手的棄牌和跟注無差別。
類似地,1-α這個比例也很有意思:
1 – α = 1 – 1/(P+1)
1 – α = P/(P+1)(限注情況)
即使我們只介紹了限注情況,α可以被推廣到不同下注大小的遊戲里:
α= s / ( P + s )(各種下注大小)
s是相對於底池的下注大小(比如,在100的底池裡下注50,s = 1/2)
注意到這裡隨著底池增長,α,詐唬比例隨之變小;也就意味著,Y在大底池詐唬更少。這看上去比較違背直覺,實際上是因為大底池的成功詐唬收益更多了,但是這是最優打法的一個重要原則:
詐唬在最優打法里其自身經常是沒有利潤的打法。然而,混著詐唬和價值下注保證了最優打法在無論對手如何應對都可以獲得價值。當對手過多棄牌則支付價值給了詐唬,而對手跟注過多則支付給了價值下注。
我們現在可以總結,這個遊戲的最優策略是:
答案:
Y下注所有堅果牌和α的詐唬,或者全部牌的α/2
X跟注所有手牌的1- α。
攤牌前Y的遊戲期望如下:他贏1個單位當他價值下注並且被跟注。回顧之前他手中一半堅果一半空氣,因此他價值下注頻率也就是1/2 。當他詐唬成功時,他贏下整個底池,而失敗時也就是被跟注後損失1個單位。我們知道X會跟注足夠的頻率讓他的詐唬無差別。他詐唬的期望因此就是0,而遊戲的期望是:
< Y > = (價值下注頻率)(價值下注大小)(被跟注頻率)
< Y > = (1/2)(P/(P+1))
< Y > = P/2(P+1)
注意到隨著底池的增長,X的劣勢也隨之增長;他必須隨著對手價值下注頻率更高而支付更多,而Y所需要讓X跟注的詐唬卻越來越少。同時,注意到Y半池下注是沒有期望的,無論底池多大。因為當他價值下注到這個大小時,要求對手100%跟注。
先知遊戲重要的特點就是存在下注詐唬和跟注比例,他們基於底池大小。Y下注的價值隨著底池變大而增大。改變底池大小並且觀察對於策略的影響是我們理解撲克非常有用的工具。我們甚至可以看一下當底池非常巨大時,沒有玩家會棄掉任何有價值的牌時,會發生什麼。
推薦閱讀: