10035 賭徒的長征(1)——序言

01-28

　　在這個金秋十月，我又一次跟一道數學題杠上了。

　　這是一道關於賭徒必勝策略的問題。它的表述很簡單，但解起來卻比想像困難得多。我前後一共花了5天時間，走了各種直路和彎路，才終於曲徑通幽處；在這條長征路上，我學到了鞅的停時定理等之前從未接觸過的數學知識。

　　這一系列專欄，就來講述一下我的探索過程。很抱歉這並不能算是一系列科普專欄，要讀懂其中的全部內容，需要本科水平的數學知識——畢竟，其中有些部分都已經超越了我原有的知識範圍了。

　　我們知道，擲硬幣猜正反這種賭博方式，在硬幣均勻的情況下，每局的期望收益為0。照這樣計算，不管玩多久，不管每局下多少賭注，總的期望收益也是0。但總有些「聰明」的賭徒，提出一些「必勝策略」，聲稱按照這樣的策略來下注，最終的期望收益大於0。比如，賭徒阿笨採用的這種策略是比較有名的：

阿笨策略：初始時賭注為1塊錢，以後每輸一局，就把賭注翻倍，直到贏了為止。最後一局贏的錢數，等於之前輸掉的所有錢數的總和再加1，所以最後總能賺1塊錢。

　　這個必勝策略當然是有bug的，因為它忽略了賭本有限這一重要事實。設阿笨最初有1000塊錢。只要他在前10局賭博中贏1局，他就能如願以償地賺1塊錢；但假如他十分不走運，連輸10局，那麼他將輸掉 $1+2+4+ldots+2^9 = 1023$ 塊錢。這樣的「災難」發生的概率是 $1/2^{10} = 1/1024$ ，所以阿笨的期望收益為： $1 times frac{1023}{1024} + (-1023) times frac{1}{1024} = 0$ 。阿笨的策略，確實能把輸的概率降到很低，但隨之而來的代價是，每次贏只能贏一點，而一旦輸，就會輸得慘不忍睹。

　　賭徒阿聰覺得，阿笨每次賭注翻倍的玩法太冒險了。於是他提出了一種新的策略：

阿聰策略：初始時賭注為1塊錢。以後每輸一局，賭注就增加1塊錢；每贏一局，賭注就減少1塊錢。這樣賭下去，直到賭注減少到0，或者賭本輸光為止。

　　舉個例子：設阿聰開始時有2塊錢。第一局輸了，賭本剩下1塊錢，賭注變成2；第二局贏了，賭本變成3，賭注變成1；第三局又輸了，賭本剩下2，賭注變成2；第四局再贏回來，賭本變成4，賭注變成1；第五局再贏一次，賭本變成5，賭注變成0，遊戲結束。這樣，阿聰一共賺了3塊錢。

　　阿聰策略的奧妙，在於連續一輸一贏的時候，第二局贏的錢會比第一局輸的錢多1塊，這樣賭注不變，而賭本增加了1塊錢。同樣地，不管輸掉了多少局，只要不輸光，就總有可能全贏回來，而在這個過程中，賭注不變，賭本增加，並且前面輸的次數越多，最終賭本增加得也越多。而「一輸一贏」的這種循環，只要初始賭本大於1就能無限次進行，所以阿聰自信滿滿地只帶了2塊錢入場。

　　直覺告訴我們，阿聰的如意算盤也是不太可能成立的，因為他也忽略了輸光的可能。而全面考慮之後，期望收益應當還是0：既然每局的期望收益是0，那麼任意有限局之後，總期望收益自然也是0嘛。這個證明思路對於阿笨策略是有效的，因為阿笨策略必然在有限時間內結束——只要一贏，遊戲就結束了；而如果一直不贏，就會在有限局內輸光。但對於阿聰策略，這個思路就不完整了，因為「一輸一贏」的循環可能無限進行下去。阿聰懷有一種僥倖心理：這個「無限」，能不能打破「期望收益為0」的魔咒呢？