雙手石頭剪刀布的最優解?
小時候玩石頭剪刀布的遊戲。兩個人,兩雙手,規則是:先出一個,再出一個,發現不對,撤回一個。這個規則下的輸贏是概率事件么?有沒有最優出法?
這屬於「博弈論」範疇的問題,不僅要考慮自身策略,還要考慮對方可能採用的策略。
與 @醬紫君 的答案類似,我們第一次出拳結果出發進行討論,這裡分為相同和不同兩種情況:
雙方出拳相同
這種情形下,雙方不同出拳策略的可能結果如圖所示,「不輸」代表甲方有「不輸」的撤拳策略,而「不贏」代表乙方有「不輸」的撤拳策略。可見:
- 對任一方,選擇「與己方第一次出拳相同」,都不是一個好的選擇。
- 對任一方,只要選擇「勝於對方第一次出拳」的策略,就有「不輸」的撤拳策略。
- 對任一方,如果選擇「敗於對方第一次出拳」的策略,對方就有「不輸」的撤拳策略。
因而,如果第一次出拳相同,後續最有可能的出拳結果「和局」。
雙方出拳不同
對於這種情形,雙方不同出拳策略的可能結果如圖所示,「不輸」代表甲方有「不輸」的撤拳策略,而「不贏」代表乙方有「不輸」的撤拳策略。可見:
- 無論對於先手輸或贏的一方,選擇「與己方第一次出拳相同」都不是一個好的選擇。
- 對於先手贏的一方(甲),只要選擇「與對方第一次出拳相同」,就有「不輸」的撤拳策略。
- 對於先手輸的一方(乙),只有選擇「勝於對方第一次出拳」,才有贏得比賽的機會。
因而,如果第一次出拳不同,後續最有可能的出拳結果為:
下一步撤拳的最優選擇,要取決於二者的風險偏好程度和遊戲對於「贏、和、輸」的獎懲情況,因為該博弈是不存在「納什均衡」解的。具體說來:
- 如果甲保留「石」,那麼乙應該保留「石」來避免輸掉遊戲;
- 但如果乙保留「石」,那麼甲應該選擇「包」來贏得遊戲;
- 但如果甲保留「包」,那麼乙應該選擇「剪」來贏得遊戲;
- 但如果乙保留「剪」,那麼甲應該選擇「石」來贏得遊戲。
也就是說,這裡只對於甲方有「不輸」的撤拳策略,但並不存在雙方最優的撤拳策略。
如果甲為風險偏好者或贏得遊戲的獎勵遠大於輸掉遊戲的懲罰時,遊戲結果將是不可預測的。
該策略已為最佳,只有一種情況下會輸...
審題錯誤,重新來答!題主問的是兩個手先手出招。
原答案是以雙手同時出招模型的分析。
實際上是不用分析的,不論過程中如何勾心鬥角,最終的情形也一定會發展為雙手出招後二選一的情況,和原答案分析結果不變。
新的分析引用了大量原答案的結論,為了便於閱讀,原答案依然放在前面
——————以下是原答案——————
有點意思。
那麼分兩種情況來討論
第一種情況A:雙手出招一樣
A情況,只有對面也是兩手出招一樣,才可能必贏,比如我雙手出拳,對面雙手剪刀
其餘情況,對面只要保留布或者拳頭,就可以利於不敗之地
那麼如果我們對面的人是一個一定雙手出招一樣的人,我只要雙手出招不一樣,就能保證自己不敗。
所以兩個智商正常的人玩這種遊戲,一定不會選擇雙手出招一樣
結論一:要想贏,雙手出招不一樣
第二種情況B:雙手出招不一樣
這裡再分兩種情況,兩人同招b1和兩人不同招b2
b1時
這個時候,必定有一隻手的招式和對面的兩個招式保證不敗(或贏或平)
那麼如果我們要保證不敗,這個時候我們就保留這隻手,而對面也知道這個情況,那麼他也一定會保留這隻手。
比如:我出拳布,對面出拳布,最後兩個人都會留布。
結論二:兩人同招時必定打平
b2時,必有一方有一招式可以不敗
例如:我出拳布,對面出拳剪。我就拳一定不會輸,那麼我選擇留拳。
繼續博弈情況如下
對面知道我留拳,他也留拳。
我知道對面留拳,選擇留布。
對面知道我留布,選擇留剪。
我知道對面留剪,選擇留拳。
陷入無限博弈
於是必定不敗一方的最優解就是留兩人相同的招式,於是另一方也選擇保留相同的招式。
結論三:兩人不同招時,陷入無限博弈,平手是最大利益。
於是這個遊戲的結果是最大的可能就是雙方平手。
——————以下是新增分析————————
現在就在來分析一下,先出一招後,下一招選擇的情況。
從原答案分析的結果,先出一招後,為了追求不敗,會追求己方形成b2優勢的局面。
因此不會有人選擇和第一招一樣(原因見原答案A情況分析)
再分三種情況,第一招打平打贏打輸
第一招打平最好分析,第二招二選一,進去b1或者b2,結論不變
第一招打贏,對方想贏,第二招已固定(對方出別的無腦留第一招可不敗)。
那麼我方第二招只要出對方第一招,我方形成b2優勢方,結果打平
舉例:
第一招,我拳,對方剪
第二招,對方布,我剪
第一招打輸,最終我方進去b2劣勢方,結果打平。
所以結論和原答案一致。
推薦閱讀:
※600個人站一排,每次隨機殺掉一個奇數位的人,幾號最安全?
※三個蛋撻,分別是紫薯的、提子的、黃桃的,有 80% 的把握第一個是紫薯的,有 80% 的把握最後一個是黃桃的,中間的那個是提子的概率是多大?
※怎樣降低被老師點名回答問題的幾率?
※蒙提霍爾問題(又稱三門問題、山羊汽車問題)的正解是什麼?
※一隻股票現價20,上漲或者下降的概率為0.5,每次上漲或者下跌步長為5,求漲到30塊的概率是多少?