如果將產生不可挽回的後果,你是否還會選擇一報還一報的策略?
01-26
這個問題在我和某人的討論中,先是由三體的執劍人約定而來。
如果你是執劍人,三體人已首先違反約定作出了攻擊,你會否按下按鈕,讓地球文明與三體文明同歸於盡?(個人對程心好感度很低)在討論中,又衍生出這樣的策略討論:假設地球上只有兩個超級大國A和B,雙方擁有核武類似的超級毀滅型攻擊能力,且雙方約定不首先對彼此發動攻擊,這個約定是貌似平衡的,因為雙方都具備毀滅對方的能力。假設在得知對方發起攻擊後,被攻擊的一方也有時間(按下某個按鈕),給予對方同等的毀滅打擊。那麼問題來了,如果現在B國(因為某種不明原因,對方不智的)首先發動了攻擊,A國的人在10min後即將被毀滅。你是A國的決策者,你有能力對B國發動反擊,那麼你會否按下按鈕,對B國的首先違約進行懲罰,但是後果是全體人類的滅亡。
理論上說,如果是多次博弈,一報還一報是最佳策略。那麼單次呢?後果足夠嚴重的單次呢?
題主對於所需的博弈論知識有點……囫圇吞棗……
1. 首先需要明確概念,一報還一報(Tit for Tat,簡稱TFT)是囚徒困境在無限期重複博弈時的一個子博弈精鍊均衡。2. 你所說的這兩個例子本質上並不一樣:
1)A國B國的例子,雙方是對稱的,這是一個標準式博弈,但並不是囚徒困境,而是小雞博弈(chicken game),其納什均衡是,一方攻擊而另一方不反擊。這個博弈存在先發優勢,也即如果一方先做出決策並告知另一方,前者將會受益。也就是說,如果B國已經發射了核彈,A國最好的策略是不反擊(當然,根據小雞博弈的假定,對於A國來說人類毀滅要比A國被炸更差。)2)《三體》中的例子,雙方是不對稱的(因為執劍人的做法必然導致雙方都毀滅,不存在只有三體星系遭殃而地球不遭殃的情況),這是一個拓展式博弈,也即三體星人選擇是否攻擊,在三體星人攻擊的情況下,執劍人選擇是否發出「咒語」。不過,如果此時我們認為雙方都毀滅是比地球被攻擊更差的結果,那麼和上述博弈的結果一樣(注意,只是結果一樣),在三體星人已經發動攻擊的情況下,最好的策略是不發出咒語。總結一下,你舉的兩個例子都不是單次的囚徒困境,本來就和TFT沒關係,請不要亂點鴛鴦譜。3. 然而,事實上,大國之間的核威懾是存在的,而三體星人在羅輯擔當執劍人的時候,也確實沒有敢亂動,這是為什麼呢?是因為可信威脅(credible threat)。
博弈論課上,老師給我們放過一部講述古巴導彈危機的搞笑電影,片名我忘了(2016.2.1補充:片名是《奇愛博士》,介紹見:奇愛博士 (豆瓣)),然而其劇情就是,有一方誤發射了核彈(或是導彈?),雙方高層會面試圖解決此事(因為是誤發射),然而事不遂人願,另一方表示,我們的威懾系統是自動的,不能夠人工關掉(忘了最後結局是什麼了……)這裡,自動反擊的系統,是可信威脅的基礎。任何一方,一旦選擇發射核彈,其結果都是共同毀滅,這改變了原博弈的支付(payoff),結果就是雙方都會選擇不發射核彈,世界維持和平。相反,如果A國的系統能夠人工關掉,根據上面的分析,最後人工關掉一定是更優選擇,那麼B國就會肆無忌憚地發射核彈了。《三體》中,智子曾經對程心說:「你的威懾度在百分之十上下波動,像一條爬行的小蚯蚓;羅輯的威懾度曲線像一條兇猛的眼鏡蛇,在百分之九十高度波動;而維德……他根本沒有曲線,在所有外部環境參數下,他的威懾度全頂在百分之一百,那個魔鬼!如果他成為執劍者,這一切都不會發生,和平將繼續,我們已經等了六十二年,都不得不繼續等下去,也許再等半個世紀或更長。那時,三體世界只能同在實力上已經勢均力敵的地球文明戰鬥,或妥協……但我們知道,人們肯定會選擇你的。」
在這裡,威懾度大致可以認為就是當三體星人攻擊地球時,作為執劍人選擇反擊的概率,如果這個概率足夠高,三體星人的攻擊的結果(90%甚至100%的概率共同滅亡)將比不攻擊更糟,此時相當於改變了原來博弈的支付,因此三體星人將會選擇不攻擊。
關注
又開始給程心洗地?
推薦閱讀:
※葉文潔有錯嗎?
※《三體》中大劉為什麼不安排章北海活到最後?
※如何看待《三體3:死神永生》獲得軌跡獎最佳長篇?
※如果托馬斯維德沒有兌現諾言那麼人類世界會如何發展?
※《詩云》跟《神的90億個名字》怎麼這麼像??