10035 賭徒的長征(1)——序言

  在這個金秋十月,我又一次跟一道數學題杠上了。

  這是一道關於賭徒必勝策略的問題。它的表述很簡單,但解起來卻比想像困難得多。我前後一共花了5天時間,走了各種直路和彎路,才終於曲徑通幽處;在這條長征路上,我學到了鞅的停時定理等之前從未接觸過的數學知識。

  這一系列專欄,就來講述一下我的探索過程。很抱歉這並不能算是一系列科普專欄,要讀懂其中的全部內容,需要本科水平的數學知識——畢竟,其中有些部分都已經超越了我原有的知識範圍了。

  我們知道,擲硬幣猜正反這種賭博方式,在硬幣均勻的情況下,每局的期望收益為0。照這樣計算,不管玩多久,不管每局下多少賭注,總的期望收益也是0。但總有些「聰明」的賭徒,提出一些「必勝策略」,聲稱按照這樣的策略來下注,最終的期望收益大於0。比如,賭徒阿笨採用的這種策略是比較有名的:

阿笨策略:初始時賭注為1塊錢,以後每輸一局,就把賭注翻倍,直到贏了為止。最後一局贏的錢數,等於之前輸掉的所有錢數的總和再加1,所以最後總能賺1塊錢。

  這個必勝策略當然是有bug的,因為它忽略了賭本有限這一重要事實。設阿笨最初有1000塊錢。只要他在前10局賭博中贏1局,他就能如願以償地賺1塊錢;但假如他十分不走運,連輸10局,那麼他將輸掉1+2+4+ldots+2^9 = 1023塊錢。這樣的「災難」發生的概率是1/2^{10} = 1/1024,所以阿笨的期望收益為:1 times frac{1023}{1024} + (-1023) times frac{1}{1024} = 0。阿笨的策略,確實能把輸的概率降到很低,但隨之而來的代價是,每次贏只能贏一點,而一旦輸,就會輸得慘不忍睹。

  賭徒阿聰覺得,阿笨每次賭注翻倍的玩法太冒險了。於是他提出了一種新的策略:

阿聰策略:初始時賭注為1塊錢。以後每輸一局,賭注就增加1塊錢;每贏一局,賭注就減少1塊錢。這樣賭下去,直到賭注減少到0,或者賭本輸光為止。

  舉個例子:設阿聰開始時有2塊錢。第一局輸了,賭本剩下1塊錢,賭注變成2;第二局贏了,賭本變成3,賭注變成1;第三局又輸了,賭本剩下2,賭注變成2;第四局再贏回來,賭本變成4,賭注變成1;第五局再贏一次,賭本變成5,賭注變成0,遊戲結束。這樣,阿聰一共賺了3塊錢。

  阿聰策略的奧妙,在於連續一輸一贏的時候,第二局贏的錢會比第一局輸的錢多1塊,這樣賭注不變,而賭本增加了1塊錢。同樣地,不管輸掉了多少局,只要不輸光,就總有可能全贏回來,而在這個過程中,賭注不變,賭本增加,並且前面輸的次數越多,最終賭本增加得也越多。而「一輸一贏」的這種循環,只要初始賭本大於1就能無限次進行,所以阿聰自信滿滿地只帶了2塊錢入場

  直覺告訴我們,阿聰的如意算盤也是不太可能成立的,因為他也忽略了輸光的可能。而全面考慮之後,期望收益應當還是0:既然每局的期望收益是0,那麼任意有限局之後,總期望收益自然也是0嘛。這個證明思路對於阿笨策略是有效的,因為阿笨策略必然在有限時間內結束——只要一贏,遊戲就結束了;而如果一直不贏,就會在有限局內輸光。但對於阿聰策略,這個思路就不完整了,因為「一輸一贏」的循環可能無限進行下去。阿聰懷有一種僥倖心理:這個「無限」,能不能打破「期望收益為0」的魔咒呢?


推薦閱讀:

Fallacy
概率論與隨機過程相關書籍點評(下)
Ideology
姓氏越稀有,越有可能成為精英姓氏?
Quantum Mechanics

TAG:数学 | 概率论 | 赌博 |