如果兩人對弈，A擁有能看透別人內心的超能力，那麼B應該用什麼策略才能贏？

12-19

對弈一般理解為圍棋、象棋等策略類遊戲，假設B是先手。
假設A的超能力可以不限時間、不限距離的讀取對方的思想，A、B智商都足夠高，會做出對自己最有利的方案。
問在這種情況下，B有什麼方法可以勝出？

來看一下題目：

對弈一般理解為圍棋、象棋等策略類遊戲，假設B是先手。
假設A的超能力可以不限時間、不限距離的讀取對方的思想，A、B智商都足夠高，會做出對自己最有利的方案。

接下來分析一下題干：
討論的博弈是棋類遊戲，棋類遊戲的特點是：完全信息，對稱信息，序貫博弈。
關於棋類遊戲中的信息對稱的定義問題，參見：
『博弈』是信息不對稱造成的嗎，如果信息完全對稱，還會產生博弈嗎？ - Richard Xu 的回答

完全信息，所有的棋子都擺在棋盤上，只要你足夠聰明，所有的變化你理應都能想到。
對稱信息，上述信息雙方都能看見，以往信息（以往的行棋）雙方都能看見。
序貫博弈，博弈是順序進行的。

我們再來看超能力，超能力是讀心。
對於博弈而言，讀心能起到什麼作用呢？
讀心改變的事信息的獲取，A比B掌握了更多的信息，這體現在兩個方面：
其一，如果A和B獲取的信息不同，那麼A能知道B獲取的信息，而B不能知道A獲取的信息；
其二，如果A和B本來同時進行決策，則A能在決策之前獲知B的決策。

但是，在棋類遊戲中，我們會發現，讀心並沒有什麼用。
其一，棋類遊戲是完全信息、對稱信息博弈，A和B獲取的信息是一樣的。
其二，棋類遊戲是序貫博弈，在決策之前A本來就知道了B的決策。

實際上，如果A、B智商都充分高，根據策梅羅定理，這個遊戲只會有三種結果：
1. 先手必勝，B走一步，A認輸；
2. 後手必勝，B直接認輸；
3. 必和，B直接提出和棋，A接受。
我們會發現，這一結論並不隨A是否知道B要走哪一步而改變，因為A和B都知道最佳策略是什麼，A不會通過讀心獲得更多信息。

讀者應該已經開始罵娘了，你這不扯蛋嗎，如果A、B智商都高到這個地步，那棋類遊戲早就被人類放棄了，接下來大概就要「去輪盤賭上恢復一下碎裂的三觀」了（語出《大空頭》中的Mark Baum）。

所以，我們不能假定A和B的智商有那麼高，那麼我們改變一下這個假定：A和B智商水平相同，怎麼樣？
首先，棋類遊戲是序貫遊戲不會變，所以讀心術的第二種作用一定是被廢了。
然後看第一種作用，什麼叫「智商水平相同」？
如果說「智商水平相同」意味著「根據棋盤獲得的信息相同」，那麼A不能通過讀心獲得更多的信息，所以結果不變：該怎麼下還是怎麼下。
如果說「智商水平相同」意味著「在單位時間內能夠分析棋盤獲得的信息相同」，這時候讀心才能起作用：因為你能夠獲得對方思考棋盤所獲得的信息，你就能在這個基礎上獲得更多的信息。
如果說「智商水平相同」意味著「能夠同時進行處理的信息量相同」，這時候讀心可能會起反效果：因為你獲得的信息是對方的兩倍，你不一定運轉的過來。
注意，這裡面的差別在於，第一種還是信息對稱的，後兩種是信息不對稱的。

不過，以普通人進行的對弈的水平，個人認為第二種情況比較普遍，那麼A一定是佔優勢的，B能做的最佳應對就是，盡量不要下那些依靠對方失誤而成功的棋。

那麼，讀心術在什麼時候用最好呢？
回顧一下，讀心術的作用：
其一，如果A和B獲取的信息不同，那麼A能知道B獲取的信息，而B不能知道A獲取的信息；
（利用信息的不對稱）
其二，如果A和B本來同時進行決策，則A能在決策之前獲知B的決策。
（改變決策的實際順序）

所以，讀心術發揮作用（注意，不一定是正面作用）的有兩種情況：

如果信息是不對稱的，A能夠通過讀心獲得B的信息，而B不能獲得A的信息，此時A的信息越多，其決策帶來的收益更大。典型例子是牌類遊戲（暗牌）或者軍棋，若A能獲知B的手牌，足夠聰明的A能夠利用這一信息，獲勝概率更高。
註：我本來想舉一個反例說明，信息越多可能收益越低；然而我剛才努力搜索了一下，如果信息是不對稱的但博弈是序貫的，並沒有找到反例（即A信息更多反而更糟），也就是說信息不對稱造成的「信息越多收益越低」基本上都來自於同時伴隨的從同時博弈到序貫博弈造成的先手優勢。當博弈本身是序貫時，讀心術利用信息不對稱都是有益的。

如果本來是同時決策，那麼讀心術的結果是將博弈變成B先進行決策，A後進行決策。此時就要討論原博弈是否存在先手優勢或後手優勢了：
如罰點球，存在後手優勢，守門員如果能知道罰點球的球員的決策，那守門員能夠以更高的概率撲到球。
如小雞博弈，存在先手優勢，如一方堅持不避讓，那麼後手方將會選擇躲避；再比如Stackelberg博弈（Cournot博弈的序貫Version），先手方能從中受益。

不過，還存在一種可能，但這裡的關鍵不在於「讀心術發揮作用」，而在於，A擁有讀心術這個事實本身改變了博弈結構。比如說，如果A不會讀心術，可能下圍棋的時候持白有貼目7.5目，在A會讀心術的情況下，儘管根據我們剛才的分析，A未必能從讀心術中獲利，但是很有可能對方或者裁判認為A能獲利，因此判定A持白不貼目。此時，博弈的結構發生了改變（最後的支付發生了變化），A可能因此收益更低。

這就引出了B的另一種可能的做法，要求獲得補償以保證遊戲的公平性。

首先，正如 @Richard Xu 所言，對於只有兩個參與者、對於任意一位參與者而言均只有三種結局（勝利、平局、失敗）、與運氣無關、信息完全且完美（序貫）的動態有限遊戲（不限於棋類），根據策梅洛定理可以得出，先行或後行者當一必有一方有必勝/必不敗的策略。

換句話說，策略將不再是考慮因素。在雙方的處理能力充分的前提下，遊戲機制就已經決定了最終結果。

簡單以過三關為例。這是一個先手必不敗的遊戲。兩個智力成熟的成年人A和B玩過三關，不管過程如何，最終結局必然是平局；如果A智力不足或者不理性，想輸，那麼B將可能獲勝，結局將變為狀態為(B獲勝,平局)的可能性集合。
進而可以推到類似的有限遊戲，如跳棋、象棋、圍棋等。在這類有限遊戲中，目前已解的複雜度最高的為跳棋，狀態複雜度為10^21，結果為先手必不敗；而最近經由人機大戰一役為眾人所熟知的圍棋的狀態複雜度遠高於跳棋，達到10^172，由於算力不足還不能知道最終結果。

於是，在策梅洛定理的適用範圍內，我們可得到以下推論：

如果雙方均有足夠的處理能力且雙方理性，那麼結局是固定的，先手或後行者其中一方必勝/必不敗；
如果只有一方具有足夠的處理能力且雙方理性，那麼結果集是固定的，必然包含了「先手或後行者其中一方勝利/平局」以及「處理能力優異一方勝利」這兩種可能的結果。但其沒有告訴我們兩種結果出現的概率；
如果雙方均沒有足夠的處理能力且雙方理性，那麼結果集為全集，什麼結局都有可能。依舊沒有告訴我們各種結果出現的概率。

最後的推論是我們為什麼經常玩象棋、圍棋的前提，因為人類還沒達到那種無敵是最寂寞的境界。如果讓兩個成年人每天玩過三關，我估計沒出幾天就瘋了。而具有龐大處理能力的機器更悲哀的是，它不知道勝利的喜悅。扯遠了。

然後，看到 @gan yi 提到的膽小鬼博弈，思考了一下，打算通過完善膽小鬼博弈來回答一下與題目有偏差的答案（因為@Richard Xu的答案就已經論破了）：讀心術在膽小鬼博弈中所起的作用。

這裡先不考慮讀心的問題。

假設膽小鬼博弈中有以下前提條件：
1，公共知識為雙方理性且知道對方的策略集（規避、不規避）及支付集（規避並認輸：-1，雙方都規避而平局：0，不規避並獲勝：1，不規避並碰撞：-10）；
2，時間具有最小可分的單位 t，以避免永遠撞不到的悖論；
3，在兩者距離一定且速度大於零的前提下，在從比賽開始後的某個時間點 T+t 上再進行規避機動，雙方都將無法避免碰撞，也就是存在終點 T。,

那麼，根據博弈的行動順序類型不同（靜態、動態）應該有不同的結果。

雙方參與的完全信息靜態有限重複博弈

在靜態博弈中，考慮將問題簡化為在0到A時點之間，每隔時間t就進行一次的重複博弈，雙方需要同時做出決策。

不過需要注意的是，最後一次博弈與之前的所有博弈的支付集並不一樣。
最後一次博弈的支付集為

（雙方規避：(0,0)，參與者1規避而參與者2不規避：(-1,1)，參與者2規避而參與者1不規避：(1,-1)，雙方不規避並碰撞：(-10,-10)）

之前所有博弈的支付集為

（雙方規避：(0,0)，參與者1規避而參與者2不規避：(-1,1)，參與者1不規避而參與者2規避：(1,-1)，雙方不規避但不碰撞：(0,0)）

可見差異在於雙方不規避是否會引發碰撞，從而導致損失。
由於初始狀態必然為雙方不規避但不碰撞(0,0)，而雙方不規避但不碰撞(0,0)為納什均衡，狀態穩定，雙方都沒有主動改變狀態(由不規避變為規避)的動力，因為主動進行規避將導致收益下降，從0變為-1。
那麼，我們可以知道，兩位參與者將一直維持這個穩定狀態，直到進入最後一次博弈。

那麼，在最後的時間點 T 之前的一個時間點 T-t ，雙方將進行最後一次博弈。
如果雙方均不選擇規避，那麼最終結果將必然是碰撞(-10,-10)；如果某方規避了，那就是另外一方勝出(1,-1) or (-1,1)；如果雙方都規避了，那就是平局(0,0)。那麼，因為這裡不存在唯一的納什均衡，我們將不能通過給出的已有信息來判斷最終結果。說白了，會發生哪個結果，現有信息判斷不了。
需要注意的是，納什均衡意味著狀態穩定，不一定代表最優。

下面是納什均衡的計算。
假如參與者1選擇規避，那麼參與者2選擇規避的收益為0，選擇不規避的收益為1,；假如參與者1選擇不規避，那麼參與者2選擇規避的收益為-1，選擇不規避的收益為-10。可以看到這裡不存在佔優策略，最優策略的選擇依賴於對手方的策略。
如果參與者1規避，參與者2不規避，那兩者將維持這個狀態，假如這個遊戲還要繼續下去；
如果參與者1和2均不規避，那麼這個狀態(-10,-10)是不穩定的，因為任意一方主動改變狀態（不規避變為規避）都可以得到更高的收益，為-1；
如果參與者1和2均規避，那麼這個狀態(0,0)也是不穩定的，因為任意一方主動改變狀態（規避變為不規避）都可以得到更高的收益，為1。
由此可推出，(1,-1)和(-1,1)均為納什均衡。而實際上這已經是最後一局了，均規避和均不規避的情況並不存在再次改變狀態的機會，狀態穩定與否沒有實際意義。

可能有人認為，不是說好雙方理性么？這應該是這麼想的：參與者1知道2是理性人，不會選擇和1同歸於盡，所以1選擇不規避就好了。
但理性人假設是公共知識，這意味著我知道你知道我知道你知道......無窮無盡。公共知識的巧妙就在於雙方都知道對方知道他是理性人。所以，雙方都能得出同樣的推論，注意，是推論！
參與者 1 ：我知道 2 是理性人，不會選擇和我同歸於盡，所以我選擇不規避就好了。
參與者 2 ：我知道 1 是理性人，不會選擇和我同歸於盡，所以我選擇不規避就好了。
最後，Bomb。
再次提醒，「不會選擇和我同歸於盡」是參與者 1 經過自身判斷得出的參與者2的策略選擇，並不是說參與者 2 真的就這麼想了。

但這人可能進一步認為：說不定參與者 1 知道參與者 2 會像他一開始這麼想（不選擇同歸於盡，所以不規避），那參與者 1 就會進一步做推導：卧槽，這貨有病，不能和他這麼玩。
這裡的想法有一點不正確的是，參與者 1 並不「知道」參與者2會這麼想，而是參與者 1 「相信」參與者 2 會這麼想。
這就涉及高階信仰，其與公共知識類似：我相信你會這麼做，你相信我會這麼做，我相信你相信我會這麼做，你相信我相信你會這麼做......無窮無盡。其與公共知識的差異在於一個是確定，一個是相信（我知道，但不一定是事實，也就是說包含了概率）。

所以，我覺得到這裡，應該就可以理解讀心在這裡有什麼用了：讀心術能把概率收斂起來，從「相信」變為「確定」！
我確定你會這麼做，你相信我會這麼做，我確認你相信我會這麼做，你相信我相信你會這麼做......可以看到，在這裡，高階信仰不再成立，而是變成了公共知識與高階信仰的混合體。但這個混合體有個更好的說法，信息不對稱。
基於信息不對稱，有讀心術的一方可以在對方的策略選擇的基礎上進行策略選擇。

但可惜的是，這與前面的假設是相違背的。
在靜態有限重複博弈中，我們假設了雙方同時進行決策；而這裡可以看到的是，有讀心術的一方是在對方選擇好策略之後再進行決策。所以，讀心術與靜態博弈本身是不相容的。讀心術在靜態博弈中不能起作用。

雙方參與的完全信息動態有限博弈

了解了讀心術的作用之後，下面再來討論動態版的膽小鬼博弈。

首先想說明的是，從理論來看，這個膽小鬼博弈簡化為靜態有限重複博弈是最合理的，因為這個博弈實際上不存在嚴格的先後手順序。但為了體現出讀心術的威力，我們來看看動態版的膽小鬼博弈。

在滿足原有前提條件的基礎上，我們需要對這個博弈加上別的條件來使得他滿足動態博弈的要求：先後順序以及博弈局數。然後，進一步規定先後的輪換次數為 1 （也就是說， 1 做了一次決策就輪到 2 做決策， 2 做了一次決策就到 1 做決策，一次輪換，不會出現"Now it"s my turn" forever的情況）。
另外，我們還假設有且僅有參與者1具有讀心術。這意味著信息是完全但不完美的。信息完美是指在動態博弈中，對於每一個在時點t需要作出決策的參與者而言，他們都能知道在t時點之前，所有參與者所選擇的所有策略；信息完全是指雙方都知道所有人的策略集和支付集，這個已經包括在之前的前提假設中。
在這裡，信息不完美意味著在參與者2需要決策的第t局時，參與者2並不知道參與者1在T-1局所選擇的決策。套到實際案例中，可能表現為由於時間間隔太短或者別的原因，參與者 1 在 T-t 時點選擇的策略，參與者 2 在 T 時點並沒有實際認知，而是到了 T+2t/4t/6t 才知道參與者 1 在 T-t 時選擇了這樣的策略，甚至永遠認知不到參與者 1 選擇的策略（參與者2：其實我是瞎子）。

那麼，動態版的膽小鬼博弈存在以下幾種場景（N為正整數）：

參與者1先手，博弈局數為2N
參與者1先手，博弈局數為2N+1
參與者2先手，博弈局數為2N
參與者2先手，博弈局數為2N+1

結論是：
場景1和4中，與靜態版的膽小鬼博弈一致，讀心術不發揮作用。最終結果（策略組合）取決於參與者1在倒數第二局和參與者2在倒數第一局所作出的最終策略；
場景2和3中，讀心術使得參與者1在參與者2選定最終策略後，必然能選擇佔優策略。最終結果（策略組合）取決於參與者2在倒數第二局作出了哪個策略。

解釋如下：
在場景1和4中，不管是參與者1先手還是後手，最終一局必然是由參與者2來做出選擇。由於參與者2沒有掌握到參與者1在上一局的策略，他面臨的情況實際與靜態有限重複博弈種的最後一次博弈一致，即沒有掌握任何對決策有用的信息。這意味著參與者2在最後一局會做出什麼決策是不確定的。

有人可能有疑問：按道理來說，他不是可以掌握參與者1在T-3t/5t/7t...時點的策略么？
我們簡單梳理一下參與者2的決策選擇規則：

在知道參與者1規避後，選擇不規避，直到最後一次決策；
在知道參與者1不規避後，選擇不規避，直到最後一次決策；
在不知道參與者1是否規避的情況下，選擇不規避，直到最後一次決策；
在最後一次決策中，選擇規避/不規避都是可行的。

注意，這裡沒說在最後一次中選擇不規避是合理的，只說是可行的。

第一個規則和第二個規則很好理解：除了最後一次決策外，確定參與者1在T-5t/7t/9t...時點選擇規避後，參與者2選擇不規避是佔優策略；而確定參與者1在T-5t/7t/9t...時點選擇不規避後，參與者2選擇不規避也是佔優策略。
就算參與者1選擇了規避後，遊戲並不馬上結束，需要等到最後一局才結束，而參與者1在T-t時點又選回了不規避，參與者2選擇不規避都將會達到納什均衡（參與者1保持規避(-1,1) or 參與者1變回不規避(0,0)），狀態穩定。

第三個規則是為了保持收益最大化/損失最小化，理性的參與者2所必須保持的規則。
回想一下之前在靜態博弈中關於最後一次博弈與之前所有博弈的討論：

初始狀態必然為雙方不規避但不碰撞(0,0)，而雙方不規避但不碰撞(0,0)為納什均衡，狀態穩定；
兩位參與者將一直維持這個穩定狀態，直到進入最後一次博弈。

同樣，在動態博弈中，對於參與者1和2而言，其支付集在最後一次博弈與之前所有博弈是不一樣的。其支付集與靜態博弈一致，但最後一次博弈在動態博弈中應該定義為最後兩局博弈（T時點及T-t時點）。那麼，在倒數第二局之前，參與者1沒有主動改變狀態的動力（不會主動規避），因為主動規避會降低其收益，從0變為-1；而參與者2也一樣。
其實，行動規則3就是基於初始狀態為納什均衡所推導出來的。第四個規則是這樣的。見下圖。

如圖，參與者2並不知道參與者1在 T-t 時點選擇了什麼。
就算他可以推導出理性得參與者1在 T-t 時點之前必然會選擇不規避，但在 T-t 時點中分析將會失效，根據其掌握的現有信息，參與者2無法得知參與者1在倒數第二局的策略。最終，在 T 時點，參與者2將會採取哪個策略，在現有信息的情況下也是未知的。
而參與者1也同理：由於在 T-t 時點，參與者1掌握的現有信息無法確定參與者2在最後一局的策略，其在 T-t 時點，參與者1將會採取哪個策略，在現有信息的情況下也是未知的。
最終，推導下來就是第一個結論：

場景1和4中，與靜態版的膽小鬼博弈一致，讀心術不發揮作用。最終結果（策略組合）取決於參與者1在倒數第二局和參與者2在倒數第一局所作出的最終策略。

然後，再來快速推導第二個結論。
經過上面的討論，大家對參與者1和2在之前所有博弈中的決策選擇都很了解，就不多廢話了。直接看最後一次博弈（ T-t 時點和 T 時點），如下圖。

可以看到，在這裡，參與者1看到參與者2在 T-t 時點的策略。這就是讀心術的威力！或者說，這是信息不對稱帶來的優勢。而通過這種優勢，參與者1必然可以選擇佔優策略。
假設參與者2選擇了規避，那麼對於參與者1而言，他確定參與者2的最終策略是規避，那麼在規避以及不規避之間，他選擇不規避帶來的收益更高（規避的收益為0，不規避的收益為1），不規避為佔優策略；
假設參與者2選擇了不規避，那麼對於參與者1而言，他確定參與者2的最終策略是不規避，那麼在規避以及不規避之間，他選擇規避帶來的收益更高（規避的收益為-1，不規避的收益為-10），規避為佔優策略。
但還存在一個問題：在T-t 時點，我們依舊不知道參與者2的決策選擇。參與者2在這裡（場景2/3中 T-t 時點）所處的困境與在場景1/4中 T 時點所處的困境一致，不再累述。
因此，我們雖然知道參與者1能夠選擇佔優策略，但不代表其收益就是最大的。這取決於參與者2的最終決策。同時，最終結果也取決於參與者2的最終決策。
得到第二個結論：

場景2和3中，讀心術使得參與者1在參與者2選定最終策略後，必然能選擇佔優策略。最終結果（策略組合）取決於參與者2在倒數第二局作出了哪個策略。

總結及延伸

可以看到，讀心術與靜態博弈是不相容的：讀心術要求決策必須是動態的，即存在先後順序。
同時，在動態的膽小鬼博弈中，對於不同的先後順序及博弈局數的組合（沒考慮多次輪動的情況，也就是參與者1決策兩次參與者2才決策一次等情況），讀心術能起的作用是不同的：在讀心術術者最後進行決策的情況下，讀心術使得術者能夠選擇佔優策略；在讀心術術者並非最後進行決策的情況下，讀心術不影響結果。

另外，我們可以看到在讀心術術者最後決策的情況下，佔優策略並不一定帶來最大收益。之前我們沒有討論術者擁有讀心術是否被其他參與者知曉的情況。這裡進一步討論一下。
簡單說一下結論：在動態的膽小鬼博弈中，假如其他參與者知道術者擁有讀心術，那麼在讀心術術者最後進行決策的情況下，這種信息優勢會變為劣勢，術者反而會被迫選擇對其他參與者而言的最優決策。
簡單推理一下，參與者2在 T-t 時點進行決策，他知道參與者1知道他在這個時點所選擇的策略且參與者1是理性的（公共知識），而參與者1所選擇的策略基於他在這個時點（T-t）所選擇的策略（動態博弈）。

假如參與者2選擇了不規避，那麼參與者1將被迫在規避(-1,1)以及不規避(-10,-10)之間進行選擇，而理性的參與者1必然選擇規避(-1,1)；假如參與者2選擇了規避，那麼參與者1將被迫在規避(0,0)以及不規避(1,-1)之間進行選擇，而理性的參與者1必然選擇不規避(1,-1)；

這意味著，對於在 T-t 時點的參與者2而言，其策略對應的支付集結果是可預測的。選擇不規避，結果是(-1,1)；選擇規避，結果是(1,-1)。那麼，理性的參與者2必然選擇佔優策略，即不規避(-1,1)。
此時，對於最後兩局博弈所組成的子博弈而言，存在唯一的納什均衡(-1,1)，其對參與者1和2而言都是佔優策略。

再有就是，之前一直在說，在最後一次博弈（靜態博弈）和倒數兩局博弈中（動態博弈），無法確定參與者2或參與者1和2的策略選擇，從而不能確定最終結果（策略組合）。
我們可以通過給定一個概率來確定最終結果的期望值。假設參與者1和2均有50%的概率選擇不規避，有50%的概率選擇迴避。
在靜態均衡中，每個結果的可能性均為25%，對於參與者1和2而言的期望收益均為-2.5。那麼，理性的參與者從一開始就不會玩這種只有損失的遊戲；
在動態博弈中，場景1/4同上；而動態博弈的場景2/3隻有兩種結果，可能性均為50%，對於參與者1和2而言的期望收益為0。
這已經演變了另外一種博弈。原本的膽小鬼博弈為純策略博弈，而改進後的膽小鬼博弈為混合策略博弈。後者的關鍵在於引入概率來確定不確定性。

個人最近在思考關於風險（損失的不確定性），正好看到這個問題，一時興起就寫了一個晚上。沒有複核，有錯誤或者疏漏的地方歡迎糾正。

小賢覺得在哪部英劇見過類似的問題：
《神探夏洛克》第三季第三集《最後誓言》His Last Vow 的一幕

場景如下：
Sherlock常常自詡擁有mind palace，但是碰到了無所不知的Magnussen，他可以做什麼呢？原本Sherlock以為，Magnussen的超能力來源於他的「萬能眼鏡」，然而，後來Sherlock發現所謂的「萬能眼鏡」，不過是普通眼鏡罷了，而Magnussen所有知道的一切，竟都在他的腦子裡！Magnussen具有洞察所有人過去的一切的能力，如何戰而勝之？正如Magnussen自己所言：

我只是個商人，遵紀守法不偷稅漏稅，我既沒有邪惡的計劃也沒有統治世界的野心，但我有能力隨意擺布他人，藐視眾生君臨天下，你又能奈我何？

最後Sherlock怎麼做的大家都應該知道了吧，遇到如此強勁，知道你內心所想的對手，你不可能贏。所以Sherlock一槍斃之，永絕後患。。。。

（圖片來源於網路）

拿爐石打比方————不要思考，就是懟臉

王師傅當初直播被海盜戰腳本吊打就說明了這個事實，機關算盡，不如，天命所歸

B想：我這麼走A那麼走我再這麼走A再那麼走我最後這麼走我就贏了，如果A那麼走了那我就再這麼走也能贏...（B不可能走出自己輸的變化）
A知道了B的想法，肯定不能選擇B想好的套路，因為那麼走肯定是B贏，因此就得試著尋找B沒窮舉到的走法。但由於B足夠聰明，導致B沒窮舉到的走法很少，A會花費很大的時間與精力來搜索剩餘的樹。而由題中可知，這倆人的精力與體力都是正常的，所以最後一定會導致A精力不集中體力跟不上造成漏算而失敗
尤其是圍棋這種運算量巨大的棋類

心裡罵他祖宗十八代，讓他失去理智，而又不能說你什麼

戴頭盔！

呵呵，遇到精神分裂就沒作用了。

話說超能力者和精神分裂症患者玩兒象棋，且以命打賭保證能贏。

於是超能力者先走馬，然後仔細讀著精神分裂症患者的A精神。

而A精神在想：「我需要首先把他褲子扒了，脫他褲衩兒，抽出猴皮筋兒，才能做成一個彈弓打他們家玻璃。

超能力者：「卧槽什麼亂七八糟的。」

而B精神已經作出決策了：炮起身，跳過對方的炮，吃了對方剩下那個沒走的馬。

上來就吃了個馬。超能力者一方面讀不到這個心理動向，著急。一方面又因為對方這麼奇葩的走法，滿腦子卧槽。又一方面想到自己打賭如果輸了就死。

於是心理壓力太大……他發瘋了……

所以，我們得出結論，再牛鼻的超能力者，也不能惹神經病呢。

雖然不是棋牌類，舉一個博弈論的經典例子。

有這麼個危險的比試：雙方離一定距離，騎摩托車開足馬力向對方徑直開去。哪一方先採取迴避動作，哪一方就輸了。比試雙方當然都不想輸，但更不希望一起撞死，這裡面的訣竅就在於判斷對方什麼時候認慫，並盡量給對方製造一種自己不會認慫的錯覺。

然而，如果你知道自己的對手有讀心能力，那你在這場比試當中就有了必勝策略——堅持不躲。因為對手知道你到最後也不會躲，所以只有兩個選擇：認慫輸掉比賽，或者相撞去死。對於理性人來說，輸總比死好。所以在有盤外招的情況，讀心能幫你選擇更好的結果，卻不一定能贏得比賽。對於本題的例子，只要B下定決心輸了比賽就要和A同歸於盡（並且他確實有能力做到），A大概會在比賽中放水認輸吧。
====
評論中討論了之後，僅僅是「下定決心」這個行為，確實有一種威脅力不足的情況。可以考慮改一下實施方式，比如B綁上炸彈，在輸了之後立刻爆炸，把在場人員都殺死。炸彈由自動裝置控制，所以不存在反悔的可能。

人格交換

當然你要是沒有千年神器的話，
還是直接攻擊對方玩家（物理）
比較快點

謝邀。

我不是很清楚對弈的概念，如果只是進行某種比賽，那麼還是有很多辦法的。

比如，選擇一個你最擅長體力活動，比如做菜，比如拳擊，甚至可以是彈鋼琴，利用熟練度（肌肉記憶），達到「你就是看穿我的想法肉體也模仿不過來！」這一目的。

或者，比膽量。

有讀心術的人，習慣了對於「確定性」的把握，因此，對於不確定的事情，有著天生的厭惡和逃避。

此外，有讀心術的人，心智但凡在平均線左右的，都會有很大的作為—談判高手、情感大師、賭神等等。

有一定身份地位的人，一般比較愛惜自己「已經擁有」的一切。

既然這樣，來，賭命吧，俄羅斯轉盤走起！

————————————————
問題補充為棋類運動是吧～

看過EVA沒？

專精一項外語，越是小語種越好；
設計一套密語，比如當頭炮叫小蘋果，第二次當頭炮就叫孿生小蘋果，連環炮叫大蘋果；
下棋的時候切換到德語/梵文/吐火羅文模式，再加上密語，讓他讀去吧，破譯之後再翻譯都得半天，再加上自身的運算，准讓他吐血。

其實這個問題如果從博奕論的角度上來考慮，用牌類運動比棋類運動更合適。

比如用下面的牌局，就基本類似於題主的目的了。

不能三帶二,農民先出,雙方明牌,誰會贏?

這種情況下，最好的策略其實就是找出致勝的路線，而不要碰運氣。但本來就是打牌的人應該用的策略。

棋類運動也是同樣，假設對手能看透你的心思，你最好的策略是什麼？沒什麼別的策略，就是每一手都下最好的一手，不要用騙招來欺騙對手就行。這也本來就是棋手應該用的策略。只要B不出錯，A就算會讀心術，B頂多也就是自己和自己對弈罷了。B至少有5成的可能不敗。

想想最近看的日本藝術片的內容。
然後A就沒心思和B對弈了。

這麼做是有原因的。A擁有看透別人內心的能力，這種信息不對稱的情況對B極端不利，使用任何策略，A都能做出反制措施，除非B能騙過自己或者讓A明知B要怎麼做但無計可施的情況，而這兩者都是很難實現的。從另一個角度來思考，用策略對付超能力本身，B想日本藝術片的內容，使用無用但引人注目的大量信息來吸引A的注意，讓A無法或來不及處理真正有用的信息，用感性的信息來干擾、封鎖理性的思考。當A失去了理性，A的超能力就變成了沒有彈藥的手槍一樣，讓A無法正常使用超能力來挽回一點信息不對稱的局面。
當然這麼做也有缺點，殺敵一千自損八百，這會讓AB兩人都無心博弈，只想趕緊結束比賽來一發。

封不覺←_←想著布，出石頭

參見遊戲王和魯路修

有一本漫畫叫《JOJO的奇妙冒險》，第三部有這麼一個敵人，他的特殊能力是能強迫你的內心回答yes和no。比如在跟你玩棒球遊戲的時候，他會問你的內心要扔好球嗎？扔壞球嗎？揮棒用左手？還是右手？你的內心會毫無保留地告訴對方，於是他跟人打賭幾乎是逢賭必贏的。
那麼主角到底是怎麼在電子遊戲中贏了這個敵人的呢？

答案是：主角每打一個球都會宣布要怎麼打，內心也會回答敵人，自己並沒有撒謊……可是實際控制手柄的是主角的爺爺，只要做出跟主角宣布的內容相反的行為，敵人沒幾個回合就崩潰了…

B只負責執行，不負責思考。也就是說讓另一個人去思考如何下棋。

B的心裡：
你是傻逼么，卧槽你怎麼這麼走，要按套路，套路，這麼走不對啊，卧槽你咋下這了，麻痹會不會下棋，你咋這麼笨，誰教你這麼下棋的，麻痹你沒救了啊。
我猜最後他倆會打起來。。。

B在下棋時心裡默默地想著：你要這把敢贏我，我打死你！打你粑粑麻麻，搶你女盆友！後半生讓你永無寧日！

而如果你讓我贏，我就叫你爸爸。

A望著B，默默的笑了。