標籤:

博弈論第八節

博弈論第八節--以直報怨原創 許開浩開浩聲明:本講義部分內容參考王春永著的《博弈論詭計全集》,其中部分案例採用本書,不再一一批註御書房的各位夥伴們,大家好,我們又開始煮書了,上節我們講到關於背叛的解決方法,其中有一個方法就體現的是報復力,至於怎麼體現報復力,什麼時候實施報復行為,這個話題很大,所以我們要用一節的時間,好好理解一下報復力的作用和效果。還是老樣子,我們講故事的形式完成,來說明報復力的作用。有位教授,深夜兩點的時候被一陣電話聲驚醒,接起電話,對面傳來隔壁女人的聲音:「管管你家狗,別讓它叫了,吵的我睡不著了。」教授睡覺被人打擾,當然很生氣,第二天晚上睡覺的時候定了個鬧鐘,半夜兩點醒來,撥通了隔壁女人的電話,過了好久,隔壁女人才接起電話,憤怒的問,哪一位?教授彬彬有禮的回答道:對不起,夫人,昨天忘了告訴你了,我家沒有狗。這個故事體現的就是一報還一報的智慧,一個誤會的電話,解釋也覺得不妥,報警呢,又有點太過了,於是教授用了這樣的方法還擊回去,讓對方也能感受到自己受到的不公正待遇,那麼下次這位女鄰居一定不會通過這樣的方式打擾這位教授了。在特定情況下,我們進行博弈的時候,選擇這種一報還一報的方式,是很有效果的。在西方文化里,一報還一報成為理論基礎的起源,是聖經,沒錯,就是基督教的那個聖經,有這樣的文字,摩西受上帝之命,成為在埃及做奴隸的以色列人的領袖,他發布的法令就是:要以命償命,以眼還眼,以牙還牙,以手還手,以腳還腳。《聖經·舊約·出埃及記》里記載的更為詳細,若有傷害,(這種傷害指的是傷人致死的傷害),就要以命償命,以眼還眼,以牙還牙,以手還手,以腳還腳,以烙還烙,以傷還傷,以打還打。這樣的例子我可以舉很多,在很多哲學觀點裡,這種一報還一報的方式行之有效,被很多哲學觀點所採用,論語憲問里,有這樣的記載,或曰:以德報怨如何?子曰:何以報德,以直報怨,以德報德。什麼意思呢?就是有人問孔子:以德報怨這個行為好么?孔子回答道:那拿什麼來報德呢?應該是以直報怨,以德報德才對。但是把這種策略加以科學化和實用化的,卻是美國密西根大學一位叫做羅伯特·艾克斯羅德的政治科學家,他研究的專業方向,就是人與人之間的合作關係。他設定可一套程序,前提是每一個參與方都是自私的,並且大環境下沒有權威干預個人決策。簡而言之,就是純粹的自由市場經濟的環境。利用計算機的模擬,他組織了一場比賽,這個競賽思路很簡單,讓每一個參與博弈的程序,扮演囚徒困境中的一方,每個程序都有獨立運算參考信息和儲存信息的能力,每個程序都要基於背叛和信任做出選擇,並以單賽循環的方式經行200次。結果因為這種參考信息的行為和儲存信息的能力,程序之間產生了信用檔案,這種信息處理的能力,已經基本構成了一個博弈環境必備的要素。這個比賽有14個程序參加,其中包含了各種複雜的策略,以及艾克斯羅德自己的一個隨機程序,也就是選擇背叛和信任各有百分之五十的幾率,最後的記過讓人吃驚的是,獲勝的竟然是一條「一報還一報」的策略,這個策略是由數學教授阿納托·拉波波特提交上來的。但是更有意思的是,這十四個程序中,有8個是善意的,即永遠不會先背叛的程序,輕而易舉的贏了其他六個非善意的程序。為了驗證這個讓人驚訝的結果,艾克斯羅德又做了第二輪競賽,這一次參加競賽的有63條程序,其中就有包括第一輪勝利者「一報還一報」的改良策略,結果這63個程序中,前15名,只有第8名的哈靈頓程序是不善意的,而且這次奪魁的,依然是「一報還一報」的策略。說了半天,啥是個「一報還一報」呢?其實很簡單,就是每一步都重複對方的上一步的行為,這個「一報還一報」厲害也厲害在這裡,這個策略,有如下幾個特點,第一,善良,陌生人的第一次博弈,通常都會選擇信任,首先表明立場。第二是寬容,一但對方調整策略,這頭馬上就跟著你做調整,不會因為一次背叛產生懷恨在心反覆報復的可能。第三是可以激怒,讓對方知道你不是好惹的,第四是簡單,這個策略非常簡單,基於長期博弈可複製性極高,第五就是不妒忌,在雙方博弈環境內,沒有多餘的衍生品,僅僅是針對事情的報復。呂氏春秋里記載著這樣的故事,孔子的弟子子貢從別的國家贖回,落難在其他國家做奴隸的魯國人,按魯國規定,這樣的行為可以在魯國府庫里領取獎勵,但是子貢去沒有去領。另一個孔子的學生子路,救了一個落水的人,結果那人送來一頭牛,子路欣然接受。對於兩個學生不同的行為,孔子批評了沒有領賞的子貢,卻表揚了接受牛的子路,這個道理很簡單,如果子貢不領賞,誰還去救贖魯國的人民呢?但是子路接受了獎賞,那麼很多人就會參與進來,主動的救人。這就是站在以直報怨,以德報德的基礎上,也就是對於合作的行為表示合作的態度,而不體現出不合作的態度。能看出,在很多博弈中,我們不僅是在為自己做決定,也是在為其他可能的參與者確立參考的目標。現在來看,雖然一報還一報這個策略有很多優點,其實也是有一些我們可以預見的缺點的,比如容易產生誤會,讓雙方進入到一直背叛的困境中。再比如實施一報還一報的一方總比背叛方慢半拍。再比如,什麼時候要終止報復行為,這些都是對於我們實施一報還一報所要考慮的問題。人心往往不是那麼容易揣測的,這絕對是一報還一報的難度所在,我們不能像程序一樣精確的表達自己的意圖,或者判斷對方的意圖。心理學家阿莫斯·特奧斯基和心理學家埃爾德·沙菲爾共同做了一個實驗,他們把16個學生放置於囚徒困境中,要求實驗的一方告訴另一方自己的選擇,結果發現,當得知了對方背叛自己,卻執著的擇合作的,僅有百分之三,而得知對方選擇合作的時候,只有百分之16以合作作為回應。雖然在這種半透明的信息基礎下,也僅僅只能達到這麼低的水準。但是如果雙方都隱瞞自己的選擇,而選擇合作的人,馬上上升到37%,為什麼知道的情況卻不選擇合作,不知道的情況選擇合作的幾率卻比較高呢?這二位心理學家,把這個現象稱為「擬奇想式」,人們認為通過採取某種行動,能夠影響對方的行動,而一旦人們得知了對方選擇,反而會意識到自己不能改變對方已經做出的決定。所以任何一個博弈策略一定不是一成而就的行為,一定是結合其他的策略進行完善,比如合理的溝通,比如普適的價值觀,我們之前也講過,囚徒困境中,可以用以德報怨的方式去解決,今天我們又說了以直報怨也可以解決,那麼哪個方式才是正確的方法呢?這不得不要考慮到德與直的成本問題,還要考慮到個人偏好,今天由於時間的原因,我們就講到這裡,我們下節內容將帶大家看看博弈中的成本,如何舍小取大,留一個小尾巴,為什麼那些通常看起來脾氣好的人,會忽然發火,這也許就是成本問題,別讓這個成本達到對方背叛的程度,這就是分寸問題了,好的博弈論技巧一定要搭配好的情商去執行,夥伴們,我們下節,再見。
推薦閱讀:

博弈論-納什均衡
從1-100,在評論里留下一個數,最接近平均數的三分之二的人有紅包
經典益智謎題之海盜分金
直播平台與遊戲廠商的博弈史:相愛相殺後將走向何方?
博弈論與納什平衡

TAG:博弈論 |