再談博弈論的應用：溝通的界限與中美關係

06-07

最近國際關係新評論先後登載了楊原兄與陳拯兄關於溝通對於國家間關係影響的文章。楊原兄對比了溝通與交流在不同模型下的作用。陳拯兄批評了溝通在一些情境下相對無用的觀點。兩位學者的討論對於我們更好地認識溝通的作用十分有幫助，令筆者獲益良多。此外，他們二位的討論還包含另一個重要觀察，也是筆者十分贊同的，那就是在國際關係研究與對外政策語境中，我們有時會陷入「常識陷阱」-- 一些概念與分析方法被習慣性地在文本層面誤用。常識者，常不識。關於這個問題，另一位同仁何睿兄曾指點筆者，他認為在沒有正式數理建模的前提下，博弈論在故事性和描述性方面的優勢使人們容易忽視其分析性和工具層面的特性，進而造成應用上的錯位。筆者認為這類錯位的例子包括「零和博弈」（及「博弈」概念本身）的泛用，又如「誤判」、「靈活」、「穩妥」、「共贏」、「均衡」等概念使用上的不精確。具體到溝通這一因素，無論是其必要性還是局限性，一些常識的背後也有「非常識」的細節需要明確。本文嘗試在楊、陳兩位討論的基礎上做一點補充。總的來說，筆者認為他們二位觀點中的差異也許並沒有表面看來那麼大。如何看待溝通的作用，在很大程度上取決於我們怎樣設計和認識具體模型，更取決於博弈中的行為人（如中美兩國）如何認識互動的具體利益結構與均衡策略。當前中外學界對於溝通在國際關係中的作用尚有一些問題沒有談清楚，例如如何解決溝通的效率，克服空談、噪音、認知差異等問題；另有一些問題沒有得到足夠重視，甚至尚未被問題化，例如溝通的界定、策略與行動對溝通的補充或替代作用等。而這些對於我們看待當下中美關係中的種種問題都是十分重要的。也從崔安潛平匪說起陳拯兄在文中提到了唐僖宗年間西川節度使崔安潛平匪的例子。這是個極為有趣且重要的例子，它很好地說明了對囚徒困境中溝通與合作關係的一些誤讀。盜匪在能夠任意溝通的前提下，依然選擇了告發（背叛），崔安潛殺雞儆猴，匪患遂平。不過這個例子與囚徒困境也有不同之處：西川盜匪並沒有在崔安潛的設計下相互告發以圖洗白和獎賞的機會，而是「夜不及旦，散逃出境」。也就是說，這些盜匪在合作與背叛之外選擇了第三種策略，相互背叛（如囚徒困境中的情況）並不是這一博弈的納什均衡。筆者將崔安潛處死第一名被告發盜匪之後的故事用如下展開形式表示：

1）任何一個盜匪都有三個策略選擇：出逃、串謀、告發；2）當某一盜匪不選擇出逃時，其他盜匪並不知道他在串謀與告發之間所做的選擇（因此其他盜匪的決策節點用橢圓圈住）；3）己方串謀（即合作）、對方告發（即背叛）時，按照崔安潛處理第一個案子的方法，合作者被剮並被滅家，告發者則成功洗白且獲獎勵，因此支付值假定為（-10，2）；4）相互串謀時，崔安潛無法對盜匪進行有效處置（至少暫時，按照崔的現行策略），因此盜匪不止維持現狀（0，0），其處境應該能獲得改善，如打擊崔的士氣、降低崔的人望，因此支付值假定為（1，1）；5）散逃出境的結果，盜匪雖保住性命，卻無法繼續留在熟悉的西川作案，因此會有些損失（-1，-1）；6）如果盜匪相互告發，崔安潛顯然不會同時獎勵對方，而必然是「順水推舟」將盜匪一網打盡，因此這種類似囚徒困境中相互告發的策略組合將導致集體最差結果（-10，-10）。因此，基於這個故事的設定，相互背叛並不是納什均衡，盜匪均選擇出逃，因為那樣可以帶來更高的支付值（-1）。筆者對於這些支付值絕對值的設定有武斷之嫌，但從相對值考慮卻並不隨意，它們之間的差異基本能夠體現盜匪的策略偏好。這個故事凸顯了兩個問題：一是陳拯兄點出的溝通在一定條件下的無用性；二是重複博弈和無名氏定理在現實中的局限性。無名氏定理告訴我們，只要有足夠耐心任何一組支付值都有可能被實現，但這裡的盜匪顯然不敢在生死問題上「試錯」，他們根本沒有時間去像囚徒困境中的行為人一樣在多次博弈中進行學習而達成合作（串謀）。不過《資治通鑒》在一些關鍵細節上沒有為我們提供更多的信息，特別是以下問題：盜匪可供選擇的溝通方式有哪些，如何界定溝通？盜匪可以溝通的時間節點是怎樣的，何時的溝通對合作是有效的？盜匪之間的溝通可能受到哪些干擾，為何溝通會不起作用？總之，溝通的界限在哪裡？溝通的界定：交流與策略選擇正如楊原兄所強調的，在囚徒困境的結構下（無論單次還是多次博弈），溝通不是合作的必要條件。不過怎樣界定「溝通」卻是個問題。按照建模方法中約定俗成的觀點，溝通一般是指有意識、有意願的交流，包括個體層面的言語和肢體動作，國家層面的政策宣示與會晤等。但是這種明確的交流之外，還有一種不是溝通的「溝通」，即每回合的策略選擇。筆者將前者稱為「狹義的溝通」，後者為「廣義的溝通」（工商管理以及公共關係領域也有類似區分，但是界定方式不是基於交流與策略選擇的區分）。現實中後者的例子非常多，例如第一次世界大戰中，塹壕戰雙方的某一對峙狀態持續時間較長，而雙方在這一過程中發展了「活命且讓對方活命」的合作均衡。這種合作的達成不依賴任何言語交流，而純粹依靠雙方互動過程中的策略選擇。在國家間互動中，直接交流與策略選擇的界限常常是模糊的。會晤立場與政策宣示本身可能是策略選擇的一部分，而策略選擇也經常被解讀為無聲的交流。正所謂「聽其言，觀其行」，言行在很多情況下是難以拆開的。交流與策略選擇的結合包括一類特例，即有意的情報泄露。冷戰時，博弈論專家認為「相互確保摧毀」（MAD）是不可靠的，一方遭受核打擊之後，很可能不再有意願進行反擊，因為報復並消滅對方並不能挽回己方的損失，這樣的話相互確保摧毀的報復基礎便不僅是「瘋狂」的，而且是不可信的。因此，美蘇雙方的情報機構都受命編造並泄露情報表明其領導人（如尼克松與赫魯曉夫）不理智的一面，進而提高報復的可信度。一方面，這種情報泄露是有聲的交流；另一方面，它也是無聲的策略選擇，因為這種信號表明雙方都選擇相信並堅持相互確保摧毀這一均衡策略。當我們審視當下的中美關係時，又該如何區別和綜合狹義與廣義的溝通？溝通的時機：效果與效率對於溝通與合作的關係，多數人相信前者對後者是有促進作用的。問題在於，溝通何時發生才有效、且有效率？根據過去幾十年的實驗室模擬，多數結果支持博弈開始前的溝通最為有效，且有效率。這方面的參照假設是博弈進行中的持續溝通，雖然研究者發現了不同的證據，但較為晚近的觀點總體認為當溝通發生後，其效果具有持續性。也就是說，博弈前的溝通不僅能夠提高合作的可能性，而且發生作用的效率更高（進行持續溝通是有成本的）。再回到楊原兄與陳拯兄的不同觀點，如果我們將互動方式限制在經典的囚徒困境框架下，楊兄說的沒有錯，溝通與否並不重要；而陳拯兄的想法在怎樣的情況下可能得以實現呢？我們不妨考慮下面這種情況：在經典囚徒困境的基礎上，一個新的策略「善意」被加入，並允許雙方在博弈前進行溝通。在這一模型中，博弈前的溝通階段，己方要明確告訴對方（無論對方相信與否）：「當對方選擇善意時，己方選擇合作；當對方選擇合作或背叛，或不清楚對方的選擇時，己方選擇背叛。」這樣（C，C）便可以成為（N，N）之外的另一個均衡。博弈前的溝通與第三選項乙合作C背叛D善意N甲合作C3，30，40，4背叛D4，01，11，1善意N4，01，13，3*這一模型中，知曉對方策略選擇的可能性為p，詳細數學證明參見：http://levine.sscnet.ucla.edu/lectures/evolution/bachi.pdf類似的，筆者在上一篇討論中所設想的情況也可以體現預先溝通與第三選項的作用：在首回合博弈中選擇C，並威脅如果對方選擇D，己方便選擇P。如此這般，按照逆向歸納法，在有限次重複的博弈中雙方都將在最後一輪選擇B，但之前的回合卻可能確保（C，C）的實現。有限重複博弈中的合作乙合作C背叛D懲罰P甲合作C2，20，3-3，-1背叛D3，01，1-3，-1懲罰P0，-30，-3-1，-1需要特別指出的是，上述兩種合作的達成除了溝通與恰當的策略之外，還依賴兩條前提，一是博弈的重複性，二是第三選項（特別是懲罰措施）的置信度。重複性在國家間關係中較為普遍。而第二條則需要在策略設計上克服一些困難，如「傷敵一千，自損八百」的懲罰措施便可能是不可信的（前一篇討論已談及此點，不再贅述）。總之，無論在哪種博弈類型中，溝通都可能是有效的。但為何在現實中溝通卻常常失效？溝通的阻礙：空談、噪音、與認知差異預先溝通有助於合作的出現，但溝通常常是無效的，這是由於空談（cheaptalk）、噪音、認知差異的存在。空談是影響國家間健康、有效互動的重要因素。為了探討可信度問題，一些國際關係學者將注意力放在了昂貴信號（costlysignaling）上面，並由此衍生出一系列研究議題，例如民主和評論的制度主義分支。這個視角在研究威脅信號時非常有幫助。但問題在於，涉及合作意向的表述時，多數情況下政府似乎並不像發出威脅時那樣面臨退縮之後的國內政治懲罰。因此，合作信號的傳達如何才能是可信的？心靈雞湯或處世哲學在這時也許是有幫助的：遇事先讓自己吃虧，並等待對方慢慢改變。這是一種超越「一報還一報」（或「針鋒相對」、「以牙還牙」，Tit-for-tat）的「以德報德，以直報怨」策略。這種策略也許有助於提高合作信號的可信度。但問題是，當這一方法用在國與國關係時，如何使決策者承受國內受眾的指責，如何避免被對方視為軟弱並利用，又如何在機制和心理上設定忍受極限？當然，並不是所有人都認同空談無用的觀點，如建構主義學者便認為話語和表述的作用被理性選擇流派大大地低估了。在國際關係的實踐中，決策者也的確在不斷地通過公開與私下的方式發出威脅或許諾。多數建模學者認為這些口頭表述即使能夠發揮有限的作用，也是由於行為人已然發出了更切實的昂貴信號。一些較晚近的研究試圖挑戰這種主流觀點，嘗試通過實驗的方式找出那些增強空談效果或促使行為人選擇空談策略的因素（如長期名譽），但總體來說，是否能夠把空談與昂貴信號割裂開並判斷其有效性仍然是一個挑戰。空談之外，溝通中還存在大量的「噪音」，使得博弈者區分不同信號（合作還是背叛）的能力受限。越是大型的組織和機構（例如國家）之間的互動，雜音便越多，誤解的可能性也越高。如當下中美的任何一輪博弈之前，雙方都會釋放很多關於合作意圖的闡述，但同時也都會伴隨著推責與譴責。不同國內行為人所釋放的信號也有可能不同，如軍方與外交部門、或不同黨派和利益集團。隨著中國外交決策因素的日趨多元化、美國國內政治的日益兩極化和小圈子化，噪音將越來越成為兩國精確溝通的障礙。巨人政治與菁英閉門外交的時代離我們已經很遠了。阿克塞爾羅（Robert Axelrod）認為解決噪音問題首先需要學會「自責」，不要被對方「合理」的不合作激怒；此外，更要「大度」，在本可能背叛的時候選擇合作。這樣，在長期的互動中，誤解便有可能被降低，而互信也更有可能被建立。或更簡單地時候，由於合作與背叛信號之間可能出現誤讀，博弈策略的選擇上便有必要強調寬容。寬容（或諒解）有助於降低因誤解而產生衝突或衝突升級的可能性。但與解決空談問題類似，諒解有可能被對方惡意利用，例如冷戰結束前戈爾巴喬夫和蘇聯表現出的善意與（西方眼中地）「軟弱」。最後，不同博弈人對於模型的認知差異也可能影響溝通效果。當甲擔心乙不了解當下博弈的均衡時，甲便有可能偏離均衡策略。這會帶來嚴重的兩難問題：了解均衡的行為人在面對不了解均衡的對手時有充分的動機偏離均衡，而不了解均衡的一方又如何在這種情況下學習並了解該模型的均衡？個體人的互動中，年齡的增長常常為學習提供了可能，即社會和文化規範的傳播與內化。但是國家之間如何才能進行學習？尤其當了解均衡的一方出於國家安全考慮執意偏離均衡點時。美國早於蘇聯獲得核武器，而兩國在一段時期內對核武器所帶來的戰略影響、核戰略均衡也存在不同的理解。追求單方面的優勢還是相互確保摧毀，強化首輪核打擊能力還是倚賴二次打擊能力，這些都體現了對核戰略博弈均衡點的不同認識。中美之間也可能存在著類似的情況，李彬老師認為中國對於核威懾的表述與認知都不同於西方，吳日強老師則推測若中國將來大幅度提高核彈數量則意味著將對核戰略（及核戰略認知）進行調整。總之，當兩國對於博弈本身存在不同理解時，加之空談與噪音問題，怎樣才能提高溝通的效率？經楊原兄提示，這三種溝通阻礙的性質是不同的。空談主要是策略選擇是否得當的問題，而噪音與認知差異則更接近於結構性障礙（楊原兄稱其為不可消除的摩擦力）。那麼在看待中美關係或把握對美政策時，應如何在這些不同的溝通障礙上尋找著力點？中美之間：博弈類型與溝通界限一些學者（如李成）認為戰略互疑是目前中美關係不（夠）好的最主要原因。對這一觀點進行判斷前，我們可以先考慮兩個問題：首先，溝通能否消除互疑；其次，（狹義的）溝通對於信息傳遞和意圖判斷是否必需？基於前面的討論，我們大體可以得出結論，單純的溝通無法消除互疑。基德（AndrewKydd）主張通過再保證（reassurance）這種昂貴信號建立國家間的互信。而此時的困境依然是，如何確保善意的忍讓不被利用，如何在好意被再三「辜負」之後繼續該策略直至互信建立？在涉及國家安全的問題上，國家是否有試錯的耐心和膽量？如果沒有的話，是否存在類似西川盜匪的第三種選項？擱置爭議與凍結爭端是否類似這第三選項？如果沒有可行的第三選項，在缺少試錯空間或時間的問題上（如領土爭端之於中國、主要盟國利益之於美國），互信怎樣才能得以通過溝通來建立？當然，如前面塹壕戰的例子，溝通在戰時依然是可以繼續的，試錯空間或時間依然是存在的，而互信或默契也可以通過某種方式得以建立（又如抗日戰爭戰略相持階段國軍與日軍在正面戰場，八路軍與日軍、偽軍在敵後戰場）。但是判斷互信與默契的作用取決於我們的政策目的，對於目前的中美關係而言，首要的問題不是如戰時一般避免衝突升級，而是減小衝突發生的可能性。此外，（狹義的）溝通對於信息傳遞是否必需？費倫（JamesFearon）在討論信息可信度時曾強調過兩種途徑，包括增加沉沒成本。例如，在大國博弈尤其是安全問題上，軍事裝備計劃和軍事戰略規劃便可作為非常重要的、指向明確的沉沒成本。任何一個大國的裝備計劃都產生極大的成本和長周期影響，這是不隨外交辭令而改變的。陸伯彬（RobertRoss）曾於2009年撰文認為中國裝備航母主要是民族主義的結果。筆者不同意這種說法，因為他忽略了中國裝備航母這種「大船」以外體系化的軍事現代化建設與任務轉型。再例如，最新的中國國防白皮書《中國的軍事戰略》發布之後獲得了極大關注，但其中所傳遞的許多信息對於特定受眾（如美軍）而言應該並不是什麼新聞，因為它所宣示的方向性指標很多已在過去幾年中國軍力建設中得到了體現。在我們考慮溝通對於中美關係的作用時，還需要明確兩國互動的結構。如果套用現有的經典博弈模型來解釋中美互動，筆者認為中美（至少）目前的關係很像囚徒困境（匪匪之間）。不過，這僅僅是對於整體基本盤而言。何睿兄的提示非常重要，中美在何種情況下是匪匪關係，何時又更像警匪關係？在囚徒困境的背後，首先可能存在兩國國內行為人之間跨越國界的協調博弈。來自中美兩國的同類型行為人，對於兩國關係的某種狀態（衝突或合作）可能存在相近的偏好，並期盼實現策略上的協調。這樣的均衡將使雙方分別在本國的政治經濟體系中獲益，例如兩國的軍隊和軍工利益集團都可能從某種緊張狀態中獲益（不過筆者認為「軍工複合體」對於中美兩國來說都是一個不準確的概念，這是題外話）。在熱點問題上，如南海，中美更像在玩「膽小鬼（小雞）」遊戲。這時的均衡是一方合作並退縮、另一方不合作並「獲勝」。而如果雙方均執意盼著對方退縮，最後便會出現兩敗俱傷的非均衡、最壞局面。如何避免「撞車」或一同「墜崖」，是中美在多數熱點爭端問題上的共同利益。這樣，我們便面臨一個複雜的問題：一方面，中美兩國在不同的博弈結構下面對著不同的單一策略及混合策略組合；另一方面，這些單一博弈中的均衡在多重博弈的框架下也許根本不成其為均衡。魚與熊掌常常不可兼得，而更麻煩的是，我們也許連哪些是魚或熊掌都不知道。那麼溝通除了有可能幫助中美在單一博弈下向合作均衡聚合，是否也有可能幫助中美兩國更好地了解彼此在多重博弈中的位置？聽其言，觀其行，說來容易做來甚難。我們需要跳出常識的假象和對某些概念的習慣性泛用，細究溝通（及其他行為）在國際關係總體規律和外交政策具體實踐中的影響。中美兩國關係中的不和諧主要是由於戰略互疑嗎？什麼是和諧？而我們又真地有必要期待一個和諧的中美關係嗎？怎樣的均衡對我們最有利？溝通能夠促成這種均衡嗎？中美之間溝通的邊界在哪裡？這些既是應然也是實然問題。
推薦閱讀：

※遊戲理論攻略（序）
※什麼是博弈論
※愛情博弈論
※凱利公式——A New Interpretation of Information Rate
※「花錢」與「掙錢」的博弈

TAG:博弈論 | 溝通 | 關係 | 界限 | 中美關係 | 中美 |