10035 賭徒的長征(1)——序言
在這個金秋十月,我又一次跟一道數學題杠上了。
這是一道關於賭徒必勝策略的問題。它的表述很簡單,但解起來卻比想像困難得多。我前後一共花了5天時間,走了各種直路和彎路,才終於曲徑通幽處;在這條長征路上,我學到了鞅的停時定理等之前從未接觸過的數學知識。
這一系列專欄,就來講述一下我的探索過程。很抱歉這並不能算是一系列科普專欄,要讀懂其中的全部內容,需要本科水平的數學知識——畢竟,其中有些部分都已經超越了我原有的知識範圍了。
阿笨策略:初始時賭注為1塊錢,以後每輸一局,就把賭注翻倍,直到贏了為止。最後一局贏的錢數,等於之前輸掉的所有錢數的總和再加1,所以最後總能賺1塊錢。
這個必勝策略當然是有bug的,因為它忽略了賭本有限這一重要事實。設阿笨最初有1000塊錢。只要他在前10局賭博中贏1局,他就能如願以償地賺1塊錢;但假如他十分不走運,連輸10局,那麼他將輸掉塊錢。這樣的「災難」發生的概率是,所以阿笨的期望收益為:。阿笨的策略,確實能把輸的概率降到很低,但隨之而來的代價是,每次贏只能贏一點,而一旦輸,就會輸得慘不忍睹。
賭徒阿聰覺得,阿笨每次賭注翻倍的玩法太冒險了。於是他提出了一種新的策略:
阿聰策略:初始時賭注為1塊錢。以後每輸一局,賭注就增加1塊錢;每贏一局,賭注就減少1塊錢。這樣賭下去,直到賭注減少到0,或者賭本輸光為止。
舉個例子:設阿聰開始時有2塊錢。第一局輸了,賭本剩下1塊錢,賭注變成2;第二局贏了,賭本變成3,賭注變成1;第三局又輸了,賭本剩下2,賭注變成2;第四局再贏回來,賭本變成4,賭注變成1;第五局再贏一次,賭本變成5,賭注變成0,遊戲結束。這樣,阿聰一共賺了3塊錢。
阿聰策略的奧妙,在於連續一輸一贏的時候,第二局贏的錢會比第一局輸的錢多1塊,這樣賭注不變,而賭本增加了1塊錢。同樣地,不管輸掉了多少局,只要不輸光,就總有可能全贏回來,而在這個過程中,賭注不變,賭本增加,並且前面輸的次數越多,最終賭本增加得也越多。而「一輸一贏」的這種循環,只要初始賭本大於1就能無限次進行,所以阿聰自信滿滿地只帶了2塊錢入場。
直覺告訴我們,阿聰的如意算盤也是不太可能成立的,因為他也忽略了輸光的可能。而全面考慮之後,期望收益應當還是0:既然每局的期望收益是0,那麼任意有限局之後,總期望收益自然也是0嘛。這個證明思路對於阿笨策略是有效的,因為阿笨策略必然在有限時間內結束——只要一贏,遊戲就結束了;而如果一直不贏,就會在有限局內輸光。但對於阿聰策略,這個思路就不完整了,因為「一輸一贏」的循環可能無限進行下去。阿聰懷有一種僥倖心理:這個「無限」,能不能打破「期望收益為0」的魔咒呢?
推薦閱讀:
※Fallacy
※概率論與隨機過程相關書籍點評(下)
※Ideology
※姓氏越稀有,越有可能成為精英姓氏?
※Quantum Mechanics