博弈論第八節

06-06

博弈論第八節--以直報怨原創許開浩開浩聲明：本講義部分內容參考王春永著的《博弈論詭計全集》，其中部分案例採用本書，不再一一批註御書房的各位夥伴們，大家好，我們又開始煮書了，上節我們講到關於背叛的解決方法，其中有一個方法就體現的是報復力，至於怎麼體現報復力，什麼時候實施報復行為，這個話題很大，所以我們要用一節的時間，好好理解一下報復力的作用和效果。還是老樣子，我們講故事的形式完成，來說明報復力的作用。有位教授，深夜兩點的時候被一陣電話聲驚醒，接起電話，對面傳來隔壁女人的聲音：「管管你家狗，別讓它叫了，吵的我睡不著了。」教授睡覺被人打擾，當然很生氣，第二天晚上睡覺的時候定了個鬧鐘，半夜兩點醒來，撥通了隔壁女人的電話，過了好久，隔壁女人才接起電話，憤怒的問，哪一位？教授彬彬有禮的回答道：對不起，夫人，昨天忘了告訴你了，我家沒有狗。這個故事體現的就是一報還一報的智慧，一個誤會的電話，解釋也覺得不妥，報警呢，又有點太過了，於是教授用了這樣的方法還擊回去，讓對方也能感受到自己受到的不公正待遇，那麼下次這位女鄰居一定不會通過這樣的方式打擾這位教授了。在特定情況下，我們進行博弈的時候，選擇這種一報還一報的方式，是很有效果的。在西方文化里，一報還一報成為理論基礎的起源，是聖經，沒錯，就是基督教的那個聖經，有這樣的文字，摩西受上帝之命，成為在埃及做奴隸的以色列人的領袖，他發布的法令就是：要以命償命，以眼還眼，以牙還牙，以手還手，以腳還腳。《聖經·舊約·出埃及記》里記載的更為詳細，若有傷害，（這種傷害指的是傷人致死的傷害），就要以命償命，以眼還眼，以牙還牙，以手還手，以腳還腳，以烙還烙，以傷還傷，以打還打。這樣的例子我可以舉很多，在很多哲學觀點裡，這種一報還一報的方式行之有效，被很多哲學觀點所採用，論語憲問里，有這樣的記載，或曰：以德報怨如何？子曰：何以報德，以直報怨，以德報德。什麼意思呢？就是有人問孔子：以德報怨這個行為好么？孔子回答道：那拿什麼來報德呢？應該是以直報怨，以德報德才對。但是把這種策略加以科學化和實用化的，卻是美國密西根大學一位叫做羅伯特·艾克斯羅德的政治科學家，他研究的專業方向，就是人與人之間的合作關係。他設定可一套程序，前提是每一個參與方都是自私的，並且大環境下沒有權威干預個人決策。簡而言之，就是純粹的自由市場經濟的環境。利用計算機的模擬，他組織了一場比賽，這個競賽思路很簡單，讓每一個參與博弈的程序，扮演囚徒困境中的一方，每個程序都有獨立運算參考信息和儲存信息的能力，每個程序都要基於背叛和信任做出選擇，並以單賽循環的方式經行200次。結果因為這種參考信息的行為和儲存信息的能力，程序之間產生了信用檔案，這種信息處理的能力，已經基本構成了一個博弈環境必備的要素。這個比賽有14個程序參加，其中包含了各種複雜的策略，以及艾克斯羅德自己的一個隨機程序，也就是選擇背叛和信任各有百分之五十的幾率，最後的記過讓人吃驚的是，獲勝的竟然是一條「一報還一報」的策略，這個策略是由數學教授阿納托·拉波波特提交上來的。但是更有意思的是，這十四個程序中，有8個是善意的，即永遠不會先背叛的程序，輕而易舉的贏了其他六個非善意的程序。為了驗證這個讓人驚訝的結果，艾克斯羅德又做了第二輪競賽，這一次參加競賽的有63條程序，其中就有包括第一輪勝利者「一報還一報」的改良策略，結果這63個程序中，前15名，只有第8名的哈靈頓程序是不善意的，而且這次奪魁的，依然是「一報還一報」的策略。說了半天，啥是個「一報還一報」呢？其實很簡單，就是每一步都重複對方的上一步的行為，這個「一報還一報」厲害也厲害在這裡，這個策略，有如下幾個特點，第一，善良，陌生人的第一次博弈，通常都會選擇信任，首先表明立場。第二是寬容，一但對方調整策略，這頭馬上就跟著你做調整，不會因為一次背叛產生懷恨在心反覆報復的可能。第三是可以激怒，讓對方知道你不是好惹的，第四是簡單，這個策略非常簡單，基於長期博弈可複製性極高，第五就是不妒忌，在雙方博弈環境內，沒有多餘的衍生品，僅僅是針對事情的報復。呂氏春秋里記載著這樣的故事，孔子的弟子子貢從別的國家贖回，落難在其他國家做奴隸的魯國人，按魯國規定，這樣的行為可以在魯國府庫里領取獎勵，但是子貢去沒有去領。另一個孔子的學生子路，救了一個落水的人，結果那人送來一頭牛，子路欣然接受。對於兩個學生不同的行為，孔子批評了沒有領賞的子貢，卻表揚了接受牛的子路，這個道理很簡單，如果子貢不領賞，誰還去救贖魯國的人民呢？但是子路接受了獎賞，那麼很多人就會參與進來，主動的救人。這就是站在以直報怨，以德報德的基礎上，也就是對於合作的行為表示合作的態度，而不體現出不合作的態度。能看出，在很多博弈中，我們不僅是在為自己做決定，也是在為其他可能的參與者確立參考的目標。現在來看，雖然一報還一報這個策略有很多優點，其實也是有一些我們可以預見的缺點的，比如容易產生誤會，讓雙方進入到一直背叛的困境中。再比如實施一報還一報的一方總比背叛方慢半拍。再比如，什麼時候要終止報復行為，這些都是對於我們實施一報還一報所要考慮的問題。人心往往不是那麼容易揣測的，這絕對是一報還一報的難度所在，我們不能像程序一樣精確的表達自己的意圖，或者判斷對方的意圖。心理學家阿莫斯·特奧斯基和心理學家埃爾德·沙菲爾共同做了一個實驗，他們把16個學生放置於囚徒困境中，要求實驗的一方告訴另一方自己的選擇，結果發現，當得知了對方背叛自己，卻執著的擇合作的，僅有百分之三，而得知對方選擇合作的時候，只有百分之16以合作作為回應。雖然在這種半透明的信息基礎下，也僅僅只能達到這麼低的水準。但是如果雙方都隱瞞自己的選擇，而選擇合作的人，馬上上升到37%，為什麼知道的情況卻不選擇合作，不知道的情況選擇合作的幾率卻比較高呢？這二位心理學家，把這個現象稱為「擬奇想式」，人們認為通過採取某種行動，能夠影響對方的行動，而一旦人們得知了對方選擇，反而會意識到自己不能改變對方已經做出的決定。所以任何一個博弈策略一定不是一成而就的行為，一定是結合其他的策略進行完善，比如合理的溝通，比如普適的價值觀，我們之前也講過，囚徒困境中，可以用以德報怨的方式去解決，今天我們又說了以直報怨也可以解決，那麼哪個方式才是正確的方法呢？這不得不要考慮到德與直的成本問題，還要考慮到個人偏好，今天由於時間的原因，我們就講到這裡，我們下節內容將帶大家看看博弈中的成本，如何舍小取大，留一個小尾巴，為什麼那些通常看起來脾氣好的人，會忽然發火，這也許就是成本問題，別讓這個成本達到對方背叛的程度，這就是分寸問題了，好的博弈論技巧一定要搭配好的情商去執行，夥伴們，我們下節，再見。
推薦閱讀：

※博弈論-納什均衡
※從1-100，在評論里留下一個數，最接近平均數的三分之二的人有紅包
※經典益智謎題之海盜分金
※直播平台與遊戲廠商的博弈史：相愛相殺後將走向何方？
※博弈論與納什平衡

TAG:博弈論 |