女朋友也能看懂的博弈論
《高能少年團》里有這樣一個片段,這是眾多明星一起玩的一個小遊戲:
桌子上有30塊木板,2個人輪流劈木板,每人每次可選擇劈碎一塊、兩塊、三塊、四塊或五塊,率先劈碎第30塊木板的玩家獲勝。
其實這是一個後手必勝的遊戲,大致來看是這樣的:如果你作為玩家想要獲勝的話,最後輪到你的回合時必須要剩下1~5塊木板,因為你可以把它們全部劈碎從而贏得比賽,而這隻需要在輪到對手的回合時剩6塊木板,這樣無論他劈1、2、3、4還是5塊木板,剩下的木板數一定介於1和5之間,這是你一定能贏的狀態;而想要讓輪到對手時剩6塊木板,你只需輪到你的回合時剩7~11塊木板,因為你總有辦法(你可以劈碎1~5個木板)讓你的回合結束時剩下6塊木板留給你的對手,而這隻需要輪到對手時剩12塊木板,因為他無論怎麼劈,一定給你剩7~11個木板;同樣的道理,你只需要你的回合開始時剩13~17塊木板,即對手的回合開始剩18塊木板;只需要你的回合開始時剩19~23塊木板,即對手回合開始時剩24塊木板;只需要你的回合開始時剩25~29塊木板,即對手回合開始時剩30塊木板。
畫出狀態圖如下:
遊戲開始時,如果對手是先手玩家,這時他面臨的是30塊木板(圖中第一個圓),那麼他無論劈多少木板,剩餘的木板數一定屬於圖中第一個橢圓,輪到你的回合,這時你總有辦法將木板數劈剩24個(第二個圓)從而輪到對手,這時他無論劈多少塊木板,一定給你剩下第二個橢圓里數量的木板,以此類推,最後輪到你的回合一定屬於圖中最後的橢圓狀態,即你的回合剩1~5塊木板,恭喜你贏了。可見只要你足夠聰明,無論對手採取怎樣的策略劈木板,你一定可以贏得比賽。
好了,諸如此類的博弈其實更接近一個純數學問題,這類問題基本上有如下一些共性:
有兩個玩家,
- 遊戲有一個確定的局面,該局面是雙方可見的(完全信息);
- 規則對遊戲雙方是相同的(公平的),它規定了哪些操作(策略)是可行的;
- 玩家的操作將使遊戲從一個局面確定地走向另一個局面;
- 遊戲會在有限步內結束。
滿足上述條件的遊戲,稱為無偏博弈。
無偏博弈在數學上有一定的章法可循,重新考慮上述問題,一共有30個木板,因為木板的數量總是遞減的,所以這個遊戲必將在有限步(30步)內結束。我們可以用餘下木板的數目表示局面,於是一共有30個局面,因為規定誰劈碎最後一個木板贏,這是「輪到誰誰就贏」的局面,稱為勝態,這個狀態下有1~5塊木板,先手可以採取允許的措施(劈碎1~5塊木板)使自己贏得比賽。當局面為6時,不論採取何種策略(劈碎1、2、3、4或5塊木板),局面都將走向勝態,從而6是一個必敗態,同樣的道理,上圖中的圓都對應必敗態,橢圓都對應勝態。
所以一個無偏博弈的局面可以分成兩種:必敗態和勝態。
勝態一定可以通過某種策略使局勢走向必敗態;而必敗態採取任何策略局勢都將走向勝態。
如果遊戲開始時局面是必敗態,無論你怎麼行動,都將走向勝態,然後交給對手,這是後手總可以採取適當策略使勝態走向必敗態,再交還給你。假如後手足夠聰明的話,後手就讓先手永遠面臨必敗態,而自己永遠面臨勝態,直至遊戲結束。這就是一個後手(採取適當的策略)必勝的遊戲。反之,如果遊戲開始時局面是勝態,那麼這就是一個先手必勝的遊戲。
推薦閱讀:
※經典益智謎題之海盜分金
※探索圍棋官子最優解(三):組合博弈論
※「毛衣戰」會變成「秋褲戰」嗎?
※達到目標的方法-博弈論納什均衡
※什麼是博弈論