如果將產生不可挽回的後果，你是否還會選擇一報還一報的策略？

01-26

這個問題在我和某人的討論中，先是由三體的執劍人約定而來。
如果你是執劍人，三體人已首先違反約定作出了攻擊，你會否按下按鈕，讓地球文明與三體文明同歸於盡？（個人對程心好感度很低）
在討論中，又衍生出這樣的策略討論：假設地球上只有兩個超級大國A和B，雙方擁有核武類似的超級毀滅型攻擊能力，且雙方約定不首先對彼此發動攻擊，這個約定是貌似平衡的，因為雙方都具備毀滅對方的能力。假設在得知對方發起攻擊後，被攻擊的一方也有時間（按下某個按鈕），給予對方同等的毀滅打擊。

那麼問題來了，如果現在B國（因為某種不明原因，對方不智的）首先發動了攻擊，A國的人在10min後即將被毀滅。你是A國的決策者，你有能力對B國發動反擊，那麼你會否按下按鈕，對B國的首先違約進行懲罰，但是後果是全體人類的滅亡。
理論上說，如果是多次博弈，一報還一報是最佳策略。那麼單次呢？後果足夠嚴重的單次呢？

題主對於所需的博弈論知識有點……囫圇吞棗……

1. 首先需要明確概念，一報還一報（Tit for Tat，簡稱TFT）是囚徒困境在無限期重複博弈時的一個子博弈精鍊均衡。

2. 你所說的這兩個例子本質上並不一樣：

1）A國B國的例子，雙方是對稱的，這是一個標準式博弈，但並不是囚徒困境，而是小雞博弈（chicken game），其納什均衡是，一方攻擊而另一方不反擊。這個博弈存在先發優勢，也即如果一方先做出決策並告知另一方，前者將會受益。也就是說，如果B國已經發射了核彈，A國最好的策略是不反擊（當然，根據小雞博弈的假定，對於A國來說人類毀滅要比A國被炸更差。）

2）《三體》中的例子，雙方是不對稱的（因為執劍人的做法必然導致雙方都毀滅，不存在只有三體星系遭殃而地球不遭殃的情況），這是一個拓展式博弈，也即三體星人選擇是否攻擊，在三體星人攻擊的情況下，執劍人選擇是否發出「咒語」。不過，如果此時我們認為雙方都毀滅是比地球被攻擊更差的結果，那麼和上述博弈的結果一樣（注意，只是結果一樣），在三體星人已經發動攻擊的情況下，最好的策略是不發出咒語。

總結一下，你舉的兩個例子都不是單次的囚徒困境，本來就和TFT沒關係，請不要亂點鴛鴦譜。

3. 然而，事實上，大國之間的核威懾是存在的，而三體星人在羅輯擔當執劍人的時候，也確實沒有敢亂動，這是為什麼呢？

是因為可信威脅（credible threat）。

博弈論課上，老師給我們放過一部講述古巴導彈危機的搞笑電影，片名我忘了（2016.2.1補充：片名是《奇愛博士》，介紹見：奇愛博士 (豆瓣)），然而其劇情就是，有一方誤發射了核彈（或是導彈？），雙方高層會面試圖解決此事（因為是誤發射），然而事不遂人願，另一方表示，我們的威懾系統是自動的，不能夠人工關掉（忘了最後結局是什麼了……）

這裡，自動反擊的系統，是可信威脅的基礎。任何一方，一旦選擇發射核彈，其結果都是共同毀滅，這改變了原博弈的支付（payoff），結果就是雙方都會選擇不發射核彈，世界維持和平。相反，如果A國的系統能夠人工關掉，根據上面的分析，最後人工關掉一定是更優選擇，那麼B國就會肆無忌憚地發射核彈了。

《三體》中，智子曾經對程心說：

「你的威懾度在百分之十上下波動，像一條爬行的小蚯蚓；羅輯的威懾度曲線像一條兇猛的眼鏡蛇，在百分之九十高度波動；而維德……他根本沒有曲線，在所有外部環境參數下，他的威懾度全頂在百分之一百，那個魔鬼！如果他成為執劍者，這一切都不會發生，和平將繼續，我們已經等了六十二年，都不得不繼續等下去，也許再等半個世紀或更長。那時，三體世界只能同在實力上已經勢均力敵的地球文明戰鬥，或妥協……但我們知道，人們肯定會選擇你的。」

在這裡，威懾度大致可以認為就是當三體星人攻擊地球時，作為執劍人選擇反擊的概率，如果這個概率足夠高，三體星人的攻擊的結果（90%甚至100%的概率共同滅亡）將比不攻擊更糟，此時相當於改變了原來博弈的支付，因此三體星人將會選擇不攻擊。

關注

又開始給程心洗地？