博弈遊戲
06-09
本書的部分章節會以有趣的謎題作為開端,由簡單到複雜,由理論到現實,並通過在不同情形下的決策和競爭等實例,來了解已知事實的個人決策:並在此基礎上,通過組織、國家博弈的案例,來解釋多人、多重標準的決策過程。在這個過程中,我們不但可以了解人類理性決策的原則,也可以發現人類理性中的某些難以解決的問題。博弈是一種策略的相互依存狀況,你的選擇將會得到什麼結果,取決於另一個或者另一群有目的的行動者的選擇。人生是永不停息的博弈過程。著名經濟學家保羅·薩謬爾森說:「要想在現代社會做一個有文化的人,你必須對博弈論有一個大致了解。」遊戲是人生的抽象。人就是在遊戲中學會怎樣生活、怎樣與他人相處、怎樣適應並利用世界上的種種規則,並在這個過程中確立自己的人格。通過「囚徒困境」「約會遊戲」「槍手決鬥」「美女老虎」等一次次令人興奮、充滿樂趣的遊戲歷險,你會發現生活的真實邏輯,以及可以應用於方方面面的具有普遍意義的策略原則。白波:36歲,筆名余白,做過電台、雜誌編輯,專欄作家。自1985年開始,在大陸、港台地區發表各類作品二百餘萬字,出版專著多部,較有影響的著作有《世界是個寓言》、《馬太效應》、《完美圈套》和《博弈遊戲》等。序章人生處處皆博弈人生是永不停息的博弈過程,博弈意味著通過選擇合適策略達到合意結果。作為博弈者,最佳策略是最大程度地利用遊戲規則;作為社會的最佳策略,是通過規則引導社會整體福利的增加。永不停息的博弈遊戲是人生的抽象從遊戲到人生多人博弈不可避免的矛盾公平來自博弈遊戲需有規則好規則與壞規則博弈論不是「策略大全」第1章囚徒困境人類的自私天性,使他們陷入「囚徒困境」難以自拔。社會生活和商業競爭中的許多邏輯都與這一困境密切相關。合作是可能的嗎「囚徒困境」的故事選1還是選2學生與囚犯煙草商為何不反對禁止煙草广告一定是壞事嗎第2章優勢、劣勢與均衡當你身處類似「囚徒困境」這樣的同時行動的博弈中,你的最佳策略是什麼?決定勝負的因素又是什麼?雙方的策略選擇往往是有跡可循的,並形成某種「定式」——即均衡。新聞大戰與博弈策略同時行動的優勢策略當對手有優勢策略時優勢策略與對手策略無關追求最佳,避免最差博弈的均衡——納什均衡納什均衡有什麼用警察與小偷鬥雞博弈的難局左邊還是右邊誰打電話第3章打破「囚徒困境」在「囚徒困境」中表現最好的策略直接取決於對方採用的策略,特別是取決於這個策略為發展雙方合作留出多大的餘地。這個原則的基礎是下一步相對於當前一步的權重足夠大,即未來是重要的。囚犯的救贖「一報還一報」的偉大勝利你不必每次都贏未來影響現在「籠中豬」博弈增大未來的影響為什麼出租比出售好改變收益值教育人們相互關心教育人們要回報改進辨別能力第4章戰爭法則:廟算在先有「談笑間,強虜灰飛煙滅」的指揮大師,但也同樣有「紙上談兵」的「藝術家」,有沒有什麼東西可以更可靠地告訴我們,在什麼情況下運用某種原則有效,以及為什麼有效?其實,在「藝術」和「技術」之間,我們可以找到清晰的規律。戰爭是藝術還是技術藍徹斯特定律分散敵軍,各個擊破合則兩利,分則兩害防守還是進攻屬於拿破崙的1/4世紀司令,下命令吧公平還是不公平「攻防博弈」——諾曼底登陸如何提高勝利幾率第5章皮洛斯的勝利人們都追求勝利,但不是所有勝利都值得追求。所謂「皮洛斯的勝利」指的就是「得不償失的勝利」。在投入一場戰爭之前,你必須計算成本與收益的比例。昂貴的戰爭「每個人都有自己的價錢」皮洛斯的勝利斜坡上的均衡「騎虎難下」與「協和謬誤」貿然發動的第一次中東戰爭「焦土政策」與「破釜沉舟」威脅與許諾許諾與威脅的適度原則「冤冤相報」到「兩敗俱傷」不能取勝,就該謀和第6章應對危機的策略人類最理智的時候,往往就是別無選擇的時候。「邊緣策略」是一場危險的遊戲,每一步都蘊藏著巨大的希望與危機。肯尼迪的邊緣策略懸崖還是斜坡為什麼選擇不確定性說還是不說毫無用處的核武器越「無能」,越成功逃離邊緣第7章信息與不確定性未來的不確定性源於信息,以及處理信息能力的缺乏。對個人來說,擁有信息越多,越有可能作出正確決策。對社會來說,信息越透明,越有助於降低人們的交易成本,提高社會效率。無法避免的不確定性掌握信息,破解難局「虛張聲勢」關於信息博弈的故事會所羅門王斷案破解「檸檬市場」「信用印章」信息就是權力要不要相信權威懷疑是權利的保證第8章約會遊戲擁有信息可以幫助你作出正確決策,但不能保證你作出正確決策。要實現這一點,你必須有合適的策略。別無選擇與選擇的煩惱眾里尋他千百度別選第一個碰到的人犧牲者與實驗品哲學大師的訓誡明確你的動機規避風險的決策女王選夫與最優策略不要指望最好結果第9章美女還是老虎概率是生活的真正指南,但是我們對這一指南有著太多的似是而非的誤解。在聽任命運擺布之外,我們是否還有更好的選擇?美女還是老虎概率改變了嗎要不要改變選擇我對,你也對換,絕不會吃虧老虎在哪個門三張卡片概率——生活的真正指南概率與機會先有雞,還是先有蛋絕對對稱概率的獨立和互斥性原則第10章賭場:醉鬼漫遊反對賭博不只是一種道德立場,也是一種明智的策略選擇。當你參加一場賭博時,你贏的機會是負的期望。當你使用一種賭博系統時,你總要賭很多次,而每一次都是負的期望,絕無辦法把這種負期望變成正的。為什麼賭博是壞事「賭徒謬誤」「開天眼的人」與不存在的規律為什麼買彩票把巧合神秘化的「驚奇陷阱」你有多僥倖預期是幾率乘以價值選銀行還是選賭場加大賭注,挑戰幾率何時應選擇「孤注一擲」不懂概率,當定冤大頭第11章股市:冤大頭遊戲一個繁榮的市場自然交易活躍,當然也就不可避免一些投機現象,但是如果投機盛行,成為市場的「規律」,那麼這個市場一定要出問題。股市是什麼「大家發財」究竟發誰的財「啤酒」與「泡沫」「冤大頭理論」與「鬱金香狂熱」傷兵的兩個瓶子「選美」與選股「效率市場」,誰主沉浮又見隨機漫步巴菲特為什麼能賺錢你也可以是「大師」第12章悖論「交換信封」我們的知識體系、我們對世界的認識也許並不是建立在「惟一正確」的基礎上,而在這個基礎上建立起的認識世界的方式,既是一條道路,也是一個囚籠。悖論——邏輯的套索艾畢曼德悖論別人的錢包總是更誘人信息與理性換還是不換邏輯中隱藏陷阱「獎懲分明」「破窗理論」1藏羚羊與毒品第13章理性與非理性經濟學建立在兩個假設前提上:其一,人是自私的,都在追求利益的最大化;其二,人是理性的,其所有行為都是為了實現追求利益最大化這個目的。換言之,人不但知道自己的利益所在,而且知道該如何去追求。理性的困境要買一張彩票嗎「旅行者困境」強盜分贓出乎意料的答案「先發優勢」和「後發優勢」都是理性惹的禍非理性還是理性不要目光短淺此一時,彼一時要冒險還是要成功理性假設有用嗎第14章阿羅「不可能」定理簡單地說,政治就是人的組織藝術。完美的政治是可能的嗎?阿羅「不可能」定理給了我們一個答案。你可能對此感到失望,但是,寧可知道不存在答案的問題,也決不要假裝不存在任何問題。阿羅「不可能」定理民主是一種妄想或自相矛盾既不一定正確,也不一定公平團體決策的困境「三個快槍手」暫時同盟三國博弈雜貨鋪與政黨效能與民意各種投票制度的利弊「英雄」為何成了失敗者絕對正確的決策是可能的嗎完美政治如何實現第15章決策的藝術與科學在人們的觀念中,「零和」正在被「雙贏」取代,但是「雙贏」的背後卻蘊藏著更大的危機。對此,我們還沒有找到滿意的應對策略。既然不知道該往何處去,所以要常懷謙遜謹慎之心。「零和遊戲」與「雙贏結局」獵人博弈的帕累托優勢「大家好,才是真的好」再分配的局限性為什麼「重農抑商」哈丁公用地悲劇「看不見的手」有多長公共品供給的「囚徒困境」「好人好報」用什麼減少垃圾沙塵暴的警示喪鐘為誰而鳴目光短淺或在劫難逃世界政府尾聲什麼是最佳策略序章人生是永不停息的博弈過程,博弈意味著通過選擇合適策略達到合意結果。作為博弈者,最佳策略是最大程度地利用遊戲規則;作為社會的最佳策略,是通過規則引導社會整體福利的增加。永不停息的博弈人們的工作和生活,可以看做是永不停息的博弈決策過程。人們每天從一早醒來就必須不斷地作決定,我們日復一日決定早餐要吃什麼,直到養成固定的飲食習慣;要不要到超市瘋狂採購一番;要不要看場電影、散散步、買部車、把菜吃完、在轉盤賭局裡下紅或是下黑,甚至讀一本書……不管有意無意,深思熟慮或一時衝動,你已經開始讀這本書了——這就是一個決定。還有更重大的:報考什麼學校、選擇什麼專業、從事什麼樣的工作、怎樣開展一項研究、如何打理生意、該和誰合作、做不做兼職、要不要辭掉工作、要不要競爭總裁的職位。甚至是要不要結婚、什麼時候結婚、該和誰結婚、要不要孩子、怎樣將孩子撫養成人等,這只不過是人生重大決策的幾個例子。在這些決策中,存在一個共同的因素,那就是你並不是一個人在作決定,在一個毫無干擾的真空世界裡作決定。相反,你的身邊充斥著和你一樣的決策者,他們的選擇與你的選擇相互作用。這種互動關係自然會對你的思維和行動產生重要的影響,而且別人的選擇和決策直接影響著你的決策結果。魯濱孫一個人淪落荒島,做什麼都是他自己說了算;可是等來了個「星期五」,他就要面對博弈問題了。博弈論是由兩位傑出的學者——馮·諾曼和摩根斯坦在上世紀中期創立的。用專業術語說,博弈論是「研究決策主體的行為在直接相互作用時,人們如何進行決策、以及這種決策如何達到均衡的問題」。為了解釋和理解博弈決策的相互影響,我們不妨設想一個石匠的決策和一個拳擊手的決策會有什麼區別。當石匠考慮怎樣開鑿石頭的時候,他的「對象」原則上是被動的和中立的,不會對他表現策略對抗。然而,當一名拳擊手打算攻擊對方要害的時候,不僅他的每一步計劃都會招致抵抗,而且他還面臨對方主動的攻擊。他必須設法克服這些抵抗和攻擊。在人與人的博弈中,你必須意識到,你的商業對手、未來伴侶乃至你的孩子都是聰明而有主見的人,是關心自己利益的活生生的人,而不是被動的和中立的角色。一方面,他們的目標常常與你的目標發生衝突;另一方面,他們當中包含著潛在的合作因素。在你作決定的時候,必須將這些衝突考慮在內,同時注意發揮合作因素的作用。為了自己,也為了與他人更好地合作,你需要學習一點博弈論的策略思維。正是因此,著名經濟學家保羅·薩繆爾森說:「要想在現代社會做一個有文化的人,你必須對博弈論有一個大致了解。」貼士:博弈論說來有點繞嘴,但是內容還是很好理解的,那就是每個對弈者在決定採取何種行動時不但要根據自身的利益和目的行事,也要考慮到他的決策行為對其他人的可能影響,以及其他人的行為對他的可能影響,通過選擇最佳行動計劃,來尋求收益或效用的最大化。遊戲是人生的抽象「博弈」這個詞聽起來高深莫測,其實它就是「遊戲」的意思。更準確點說,是可以分出勝負的遊戲。博弈論如果直譯就是「遊戲理論」。不妨說,博弈論是通過「玩遊戲」獲得人生競爭知識的。遊戲是什麼?簡單地說,遊戲是人生的抽象。比如國際象棋,有這樣幾種角色:國王、皇后、騎士、主教和小兵,儼然是一個政教兼具的小王國。當然,比照人生,這個模型是太簡略了,但是一樣可以反映人生的某些道理。而且,惟其簡略,這些原本被生活的複雜表象所掩蓋的道理才更清晰可見。面對複雜事物時,人們常落入見樹不見林的陷阱,被細節壓得喘不過氣來,找不到重點。而在遊戲中,可以反映出一些現實世界的問題,並將干擾因素減至最低,是一種很適當的決策入門方法。圍棋可能是最簡單也是最複雜的遊戲,它源於4000年前的中國,但直到現在,我們也未必真弄懂了它。最簡化的棋盤——縱橫各19條線(最初是17條)編織成的一張網;最簡化的棋子(只分黑白兩色);最簡單的規則(輪流下子,兩氣活棋,空多者勝,再加上一些「劫爭」之類的補充規定),一個對圍棋一無所知的人也能在幾分鐘內學會,可是它的玄妙深奧卻又超過了任何一種棋類遊戲。如果你對圍棋下過一些工夫,你就一定能從中領悟某些哲理,例如「不輸就是贏」、「流水不爭先」、「亂中求勝」、「過猶不及」等等。在這一點上,遊戲有些像我們從小閱讀的寓言故事,我們不正是從這些「小中見大」的故事中學會生活的道理嗎?不要小看遊戲,它的確是人生的模型。從小我們就是從遊戲里學習怎樣生活、怎樣與他人相處、怎樣適應並利用這世界上的種種規則,並在這個過程中確立自己的人格。因此,千萬不要低估遊戲,它確實能反映真正的人生。貼士:零和遊戲:遊戲者有輸有贏,但整個遊戲的總成績永遠為零。整個博弈的過程就是一個零和遊戲。從遊戲到人生一個參加了海灣戰爭的美國飛行員回國後,有人問他對戰爭的感想,他回答道:就像在玩電腦遊戲。事實上,現在很多電腦遊戲已經被應用于軍事訓練。「9·11」之後,微軟的一款飛行遊戲受到了關注,因為在遊戲中,玩家可以體驗駕駛飛機在紐約等大城市上空飛行的感覺,甚至可以從世貿大樓中間穿過。人們擔心:恐怖分子可以藉助這個遊戲獲得練習機會,或許他們已經這樣做了。遊戲是學習的好方法。擊敗了拿破崙的威靈頓公爵曾說過:「滑鐵盧之役的勝負是在伊頓中學操場上決定的。」平時勤於練習技巧和戰術,在危急時才不致慌了手腳,這個原則適用於大多數的比賽或遊戲。最妙的是:在遊戲過程中,你不會損失任何東西當然除了部分自尊外,即使是輸了也不會有什麼損失。在大富翁的遊戲中,你可以從一眨眼輸掉幾百萬元的經驗里,學會如何精明地買賣房地產,事後又不必付出任何代價。當然,遊戲各不相同,對遊戲者的要求也不同。有些人長於思考性的遊戲,但不同的運動項目對決策智慧有不同程度的要求,例如在拳擊或相撲這樣按「重量級」來劃分比賽等級的遊戲中,聰明才智就不那麼重要了。玩遊戲需要用到許多不同類型的技巧。其中一種是基本技巧,比如打籃球不能缺少的投籃能力、在法律界工作不能缺少的案例積累、玩圍棋遊戲的時候還需要記住大量的「定式」(雙方可以接受的變化,可稱為圍棋盤上的「均衡」)等。這些技巧一旦脫離了遊戲,可能就沒有多大用處了。但博弈論的策略思維則是另外一種技巧。策略思維從你的基本技巧出發,考慮的是怎樣將這些基本技巧最大限度地發揮出來,這是具有普遍意義的原則,可以應用於生活的方方面面。戰略的籌劃和博弈論的道理其實是相通的:你的決策必須贏過對手,個人、家庭、部族或國家才有活命的機會。貼士:法國著名女高音歌唱家瑪·迪梅普萊有一個很大的私人園林。每逢周末,總是會有人到她的園林里採花、拾蘑菇,更有甚者還在那裡搭起了帳篷露營野餐。雖然管理人員多次在園林四周圍上籬笆,還豎起了「私人園林,禁止入內」的木牌,可所有這些努力都無濟於事。迪梅普萊知道了這種情況後,就吩咐管理人員製作了很多醒目的大牌子,上面寫著「如果有人在園林中被毒蛇咬傷後,最近的醫院距此15公里」的字樣,並把它們立在園林四周。從此以後,再也沒有人私自闖入她的園林了。——如果習慣的方法不能解決問題,就要調整自己的視角和觀念。多人博弈不可避免的矛盾遊戲不只限於兩個對手,有很多遊戲是多人參加的。如果後果要由許多人共同承擔,那麼整個決策過程將會更加困難;因為你將面臨不同成員與不同目標的排列組合。而關於多人決策,可以通過小組對抗的模式來了解,在這類競賽中,好的決策可以創造勝利。真正的多人決策有許多不同的形態:有時候雖然參與決策人數眾多,卻只要一種意見,這是理想委員制;有些是兩人共同參與決策,但卻處於對立的狀態,如角力、下棋、擊劍、網球單打等;另外還有多人多意見的決策形態,如國會、聯合國、撲克牌局、政治黨派等。姑且不論生活品質高低,這些決策的終極目標都是為了追求人類在地球上的永續生存。然而,雖有許多極重要的決策有待確定並付諸實施,但我們卻沒有一套理性的做法完全避免「三個和尚沒水喝」之類的困境。每個決策者與選擇方案的組合都自成一個系統,成就的決策好壞不一,也有些組合則完全無法運作。在某些情況下,根本不可能作出不自相矛盾的決策。博弈是一種策略的相互依存狀況:你的選擇即策略將會得到什麼結果,取決於另一個或者另一群有目的的行動者的選擇。處於一個博弈中的決策者稱為參與者,而他們的選擇稱為行動。一個博弈當中的參與者的利益可能嚴格對立,一人所得永遠等於另一人所失。這樣的博弈稱為零和博弈。不過,更常見的情況是,既有共同利益,也有利益衝突,從而可能出現導致共同受益或者共同受害的策略組合。在實踐當中,博弈可能包含一些相繼行動過程,也可能包含一些同步行動過程,因此須將技巧綜合起來,靈活運用,思考和決定自己最佳行動應該是什麼。貼士:如果你離開雙方相互適應的簡單原則,那麼你的聰明是不會有好結果的。公平來自博弈博弈不一定是壞事,也未必不能取得好的結果。我們今天享受的豐富的物質生活,都是來源於自由市場的競爭——同樣也是博弈的結果。亞當斯密在1776年所發表的經典之作《原富》,其中關於自私行為與市場運作的兩段,是經濟學上被引用得最多的名言:「很多時候,一個人會需要兄弟朋友的幫助,但假如他真的要依靠他們的仁慈之心,他將會失望。倘若在需求中他能引起對方的利己之心,從而證明幫助他人是對自己有益的事,那麼這個人的成功機會較大。任何人向他人提出任何形式的交易建議,都是這樣想:給我所需要的,我就會給你所需要的——這是每一個交易建議的含義;而我們從這種互利的辦法中,所獲的會比我們所需的更多。我們的晚餐不是得自屠夫、釀酒商人,或麵包師傅的仁慈之心,而是因為他們對自己的利益特別關注。我們認為他們給我們供應,並非行善,而是為了他們的自利。」「所以,每個人都會盡其所能,運用自己的資本來爭取最大的利益。一般而言,他不會有意圖為公眾服務,也不自知對社會有什麼貢獻。他關心的僅是自己的安全、自己的利益。但如此一來,他就好像被一隻無形之手引領,在不自覺中對社會的改進儘力而為。在一般的情形下,一個人為求私利而無心對社會作出貢獻,其對社會的貢獻遠比有意圖作出的大。」政治領域同樣如此。儘管美國的民主政治並非像某些人鼓吹的那樣完美,但立國200多年的實踐,還是可以說明這個體制有很多可取之處。美國的民主制度最為關鍵的基礎是1787年的制憲會議。參與該會議的55位代表都是當時的有識之士,但是他們並不是聖人,這是一個集體博弈的例子。一方面,他們富有遠見,希望創造新的政府形態以避免兩件事的發生,一是獨裁,他們早就受夠了英國王室的專制;二是混亂,大伙兒一致認為這比獨裁還要糟。他們建立複雜的制衡制,目的就是試圖在兩個極端中尋找平衡點,消弭大小州之間的差異。但是同時每個人又代表著各自的集團利益,在政治、經濟利益分配方面各有立場,爭吵不休。最終形成的美國憲法可說是「遠見」和「妥協」的綜合成果。事實上,很難說究竟是前者的遠見卓識,還是後者的爭權奪利對美國的政治體制貢獻更大。遊戲需有規則任何遊戲都有自己的規則。生活這個博弈遊戲自然也是如此,這就是法律、道德和各種成文或不成文的規章制度和慣例等等。當然,這些規則也不是一成不變的,它會隨著情況的改變和人們的要求不斷修修補補,但是只要規則存在,你就必須服從它,否則就要大吃苦頭。其實,也可以說,那些企圖通過非法手段獲取利益的人具有某種「創新」精神——他們試圖在社會通行的規則之外另搞一套。社會的遊戲規則固然是穩定的、安全的,可是來得太慢了。如果我能一下子弄到一大筆錢,為什麼還要一分一分地掙?應該說,這種不勞而獲的心理是普遍的,可是為什麼它沒有成為社會的普遍行為呢?銀行大盜總有某些傳奇色彩,可是研究人類行為的社會學家告訴我們:搶劫銀行可能是最不划算的人類行為之一。其成功率之低、風險之大(包括漫長的法律追溯期)、潛在的不確定因素之多,簡直令人懷疑還要做這事的人是否具備正常的理智。據一項統計:每1000起這類案件中,真正得手的只有110,而且搶到的錢也少得可憐:平均不到2000元。按照一位長期研究銀行搶劫案的犯罪學專家的想法,銀行大盜們不該被送進監獄,而是該被送進瘋人院。貼士:犯罪為什麼不是好買賣?風險太大算一個,不利於財富積累算一個,缺乏必要的約束機制(這就是為什麼罪犯不會適時收手的原因)也算一個。這些原因都可以歸結為一點:作為個人,試圖挑戰規則總是要付出代價的。好規則與壞規則規則定得過死,遊戲不好玩;可是如果規則寬鬆得形同虛設,遊戲又玩不下去。制定規則的分寸,著實不好把握。好的規則是既能保證不出亂子,又能最大程度地給遊戲者選擇的空間。就如我們前面談到的圍棋,最簡單的規則卻創造了最複雜的藝術,即使在這個電腦時代,技術專家還是無法製造一台「圍棋深藍」打敗人類,給我們的智慧保留了一些面子,為此不能不感謝這個「完美的制度」。在人類社會中影響最深遠的問題是「效率」與「公平」的矛盾,也就是找到一種穩定且公正的方法來管理並分配各社會團體的所有成員,其利益、責任、義務、權利的方法。這些都是在政府出現之前就需要處理的。古老的政府形態都要確立一個領導人,他擁有絕對的權威,借用武力、共識、年齡、家世,或是宣稱擁有神權以主導重大決策。在危急的情況下,一個受認可的領導者不論多麼無能,都比完全沒有領導人要來得好,所有的軍隊都明白這個道理。絕對權威也許並不公正,卻可以發揮效用,特別當危機來臨時更是如此。權威體制的另一種形態就是交由法律管理,在這樣的制度下會產生一套嚴格而概括性的規範,這套規範可能自古老傳統衍生而來,像各種宗教經典及漢謨拉比法典都是很好的例子,十誡則可算是一種精簡版。至於其他規範來自於普遍共識,在這種情況下,所有的決策都只能達到最低標準,對置身其中的人可不一定是件好事。此外,還有一些規範是來自多數人的約束。這方式可能產生所謂的多數暴力,使得少數人的權益被犧牲掉。這個問題會因時間而變得微不足道,但在民主制度中是無法避免的。邱吉爾曾經表示,民主是無法避免的惡,這句話正說明了上述的兩難。博弈論不是「策略大全」一本關於決策的書首先必須說服讀者,理性地作決策是辦得到的,而且也確實能改善決策品質。其次要告訴讀者如何理性地作決策。我們常強調自己作重大決策都要經過深思熟慮,可是事實未必如此。如果再繼續逼問下去,就只好承認,偶爾還是得碰碰運氣,其實有時候並沒有太多選擇,因為命運這類因果的因素時常會影響決定,所以也只好見招拆招。不過,當情況危急,或者直線式思考也能發揮作用的時候,沒有選擇的決策還是很重要的,也會帶來好結果。當然,遊戲不能直接拿來作為生活教材,只能片面反映現實狀況。歌德有一句名言,大意是抽象的理論是蒼白的,而生命之樹常綠。同樣,抽象的人生模型也許可以反映理性的決策,但是未必能完全照搬於現實。就個體而言,由於決策人可自行決定並承擔後果,因此,理論上應該有所謂的「最佳決策模式」,但仍無法保證每次都能作出最好的選擇。在人生的奮鬥過程中,人們經常因一時衝動而作出決定,結果有好有壞,但事後卻很少記得自己的選擇是對還是錯。至於那些相當重要的決策,我們要麼慶幸自己做對了,要麼就幻想著不然的話會如何如何。一樣米養百樣人,有些輕率、大膽、可愛的人會嘗試各種不同的事物,成為暢銷小說與電視劇中的英雄人物。而這些魯莽的英雄在作者的保護下,不必為其膽大妄為付出應有的代價所謂魯莽也就是做事不經大腦。他們可以從很高的地方跳下來卻毫髮無傷,現實生活並非如此另一種人則因優柔寡斷、垂頭喪氣、害怕犯錯,一輩子也成就不了任何值得留念的事迹。「好花堪摘須及時」,就是告訴我們,要把握機會。還有些人只作極端保守的決策,竭盡所能避免錯誤,他們也一樣無法完成任何值得回憶的事,而在這兩種極端之間更存在著許多空間。本書的部分章節會以有趣的謎題作為開端,由簡單到複雜,由理論到現實,並通過在不同情形下的決策和競賽等實例,來了解已知事實的個人決策;並在此基礎上,通過組織、國家博弈的案例,來解釋多人、多重標準的決策過程。在這個過程中,我們不但可以了解人類理性決策的原則,也可以發現人類理性中的某些難以解決的問題,這就是某些讓人頭痛的「困境」。從個人到群體,乃至國家和人類社會,都不得不面臨這些困境,而我們能否解決它們,還有待時間考驗。值得注意的是,任何書本都無法向讀者提供一本類似「策略大全」這樣的東西。本書只能幫助讀者建立博弈策略思維的意識,了解一些基本概念和原理。假如你想將它們運用於你自己面臨的某一個具體情況,並且作出正確的決策和選擇,那麼你還得再做一些體現你自己創造性的工作。貼士:生活就是如此。我們常常自以為已經踏上了一條所謂「完美」的坦途,並準備心安理得地走下去,不經意間,卻發現當我們試圖以一種邏輯、一套方法、一條道路、一勞永逸地解決一切問題時,總難免會碰得頭破血流。第1章 囚徒困境人類的自私天性,使他們陷入「囚徒困境」難以自拔。社會生活和商業競爭中的許多邏輯都與這一困境密切相關。合作是可能的嗎在什麼條件下才能從沒有集權的利己主義者中產生合作?這個問題已經困惑人們很長時間。大家都知道人不是天使,他們往往首先關心自己的利益。然而,合作現象到處可見,它是文明的基礎。那麼,在每一個人都有自私動機的情況下,怎樣才能產生合作呢?我們對這個問題的回答極大地影響了我們在與他人的社會、政治、經濟交往時的思維和行為。最著名的回答是由托馬斯·霍布斯給出的。他悲觀地認為,在有政府存在之前,自然王國充滿著由自私的個體的殘酷競爭引發的矛盾,生活顯得「孤獨、貧窮、骯髒、野蠻和淺薄」。按照他的觀點,沒有集權的合作是不可能產生的。因此,一個有力的政府是必要的。曾經有一位人類學家寫了一個關於伊克人的故事:伊克人從前是在烏干達北方山谷里採集、打獵的游牧民族,政府決定在那裡開闢一個國家公園,於是,他們為法律所迫,不再在山谷間打獵,而成了耕種于山嶺薄地的農民。生活環境和生活方式的變化,摧毀了他們原有的社會規範,伊克人因此把自己變成了一群不可救藥的、讓人討厭的人,他們六親不認、極端自私、毫無愛心。這些人似乎生活在一起,聚集在密集的小村子裡,但他們實際上是孤寂的、互不聯繫的個人,沒有明顯的互相利用。他們也說話,但說出的只是些粗暴的強求和冰冷的回絕。他們什麼東西都不共享,從來不歌唱。孩子一旦能走路了,就把他們趕出家門去搶劫。只要可能,隨時都會把老年人拋棄,讓他們餓死。行劫的孩子從無能為力的老人嘴邊搶走食物。他們生兒育女時毫無愛心,甚至連粗疏的照顧都沒有。他們在彼此的大門口排便。他們對鄰居幸災樂禍,只是見到別人不幸時他們才笑。他們常常笑,也就是常常有人倒霉。伊克人因此成為文學上的一個象徵,用來代表整個人類失去信心、失去人情味後的命運將是什麼。今天,世界各個國家在沒有統一領導(聯合國只是個協調機構)的情況下交往。因此,產生合作的必要條件就與國際政治的許多中心問題有關。最重要的就是安全困境:國家往往通過那些威脅到其他國家安全的手段來尋求自身的安全。這個問題體現在區域衝突和軍備競賽上。在日常生活中,我們會問自己還要請多少次那些從來不回請我們的客人來就餐。一個機構中的管理者為了得到一些回報而給另一位管理者提供幫助。一個得到絕密消息的新聞記者為了得到進一步的消息而對來源保密。如果只有兩個公司同時生產一個產品,一個公司定較高的價格是為了期望另一個公司也能保持高價,因為這樣,雙方都能得到好處(當然消費者吃虧了)。合作中存在著一個根本問題,兩個工業國家之間相互設置貿易壁壘便是一個很好的例子。由於自由貿易能給雙方帶來好處,因此,如果兩個國家消除這些貿易壁壘都能受益。問題是,無論誰單方面採取行動消除自己一方的貿易壁壘,它都會發現自己處於不利於本國經濟的貿易狀態下。事實上,不論一個國家如何做,另一個國家保持它的貿易壁壘總是比較有利的。因此,每一個國家都有利益動機來保持貿易壁壘,儘管由此帶來的結果比雙方都合作差得多。這個根本問題就是:個體對自身利益的追求會損害整體的利益。為進一步了解大量的具有這類性質的情況,需要有一個方法來表示這些情況的共同點,同時避免陷於每個情況的具體細節,即著名的「囚徒困境」遊戲。啟示:一隻河蚌正張開殼曬太陽,不料,飛來了一隻鷸鳥,張嘴去啄它的肉,河蚌急忙合起兩張殼,緊緊地鉗住鷸鳥的嘴巴。鷸鳥說:「今天不下雨,明天不下雨,就會有死蚌肉。」河蚌說:「今天不放你,明天不放你,就會有死鷸鳥。」誰也不肯鬆口。有一個漁夫看見了,便走過來把它們一起捉走了——在對手的背後,往往還有更大的、共同的敵人。「囚徒困境」的故事1950年,數學家塔克任斯坦福大學客座教授,在給一些心理學家作講演時,他用兩個囚犯的故事,將當時專家們正研究的一類博弈論問題,作了形象化的解釋。從此以後類似的博弈問題便有了一個專門名稱——「囚徒困境」。借著這個故事和名稱,「囚徒困境」廣為人知,在哲學、倫理學、社會學、政治學、經濟學乃至生物學等學科中,獲得了極為廣泛的應用。所謂的「囚徒困境」,大意是這個樣子的。甲、乙兩個人一起攜槍準備作案,被警察發現抓了起來。警方懷疑,這兩個人可能還犯有其他重罪,但沒有證據。於是分別進行審訊,為了分化瓦解對方,警方告訴他們,如果主動坦白,可以減輕處罰;頑抗到底,一旦同夥招供,你就要受到嚴懲。當然,如果兩人都坦白,那麼所謂「主動交代」也就不那麼值錢了,在這種情況下,兩人還是要受到嚴懲,只不過比一人頑抗到底要輕一些。在這種情形下,兩個囚犯都可以作出自己的選擇:或者供出他的同夥,即與警察合作,從而背叛他的同夥;或者保持沉默,也就是與他的同夥合作,而不是與警察合作。這樣就會出現以下幾種情況(為了更清楚地說明問題,我們給每種情況設定具體刑期):如果兩人都不坦白,警察會以非法攜帶槍支罪而將二人各判刑1年;如果其中一人招供而另一人不招,坦白者作為證人將不會被起訴,另一人將會被重判15年;如果兩人都招供,則兩人都會因罪名各判10年。這兩個囚犯該怎麼辦呢?是選擇互相合作還是互相背叛?從表面上看,他們應該互相合作,保持沉默,因為這樣他們倆都能得到最好的結果——只判刑1年。但他們不得不仔細考慮對方可能採取什麼選擇。問題就這樣開始了,甲、乙兩個人都十分精明,而且都只關心減少自己的刑期,並不在乎對方被判多少年(人都是有私心的嘛)。甲會這樣推理:假如乙不招,我只要一招供,馬上可以獲得自由,而不招卻要坐牢1年,顯然招比不招好;假如乙招了,我若不招,則要坐牢15年,招了只坐10年,顯然還是以招認為好。無論乙招與不招,我的最佳選擇都是招認。還是招了吧。自然,乙也同樣精明,也會如此推理。於是兩人都作出招供的選擇,這對他們個人來說都是最佳的,即最符合他們個體理性的選擇。照博弈論的說法,這是本問題的惟一平衡點。只有在這一點上,任何一人單方面改變選擇,他只會得到較差的結果。而在別的點,比如兩人都拒認的場合,都有一人可以通過單方面改變選擇,來減少自己的刑期。也就是說,對方背叛,你也背叛將會更好些。這意味著,無論對方如何行動,如果你認為對方將合作,你背叛能得到更多;如果你認為對方將背叛,你背叛也能得到更多。你背叛總是好的。這是一個有些讓人寒心的結論。為什麼聰明的囚犯,卻無法得到最好的結果?兩個人都招供,對兩個人而言並不是集體最優的選擇。無論對哪個人來說,兩個人都不招供,要比兩個人都招供好得多。「囚徒困境」這個問題為我們探討合作是怎樣形成的,提供了極為形象的解說方式,產生不良結局的原因是因為囚犯二人都基於自私的角度開始考慮,這最終導致合作沒有產生。在這個遊戲中,你將如何做呢?設想你認為對方將合作,你可以選合作,那麼你將得到「對雙方合作的獎勵」。當然,你也可以選背叛,得到「對雙方背叛的懲罰」。換言之,如果你認為對方合作,那麼你背叛將能得到更多的好處。反過來,如果你認為對方將背叛,那麼你也有兩個選擇,你選擇合作,那麼你就是「笨蛋」;你選擇背叛,就會得到「對雙方背叛的懲罰」。因此,對方背叛,你也背叛將會更好些。這就是說,無論對方如何行動,你背叛總是好的。到現在為止,你似乎知道該怎樣做;但是,要知道相同的邏輯對另一個人也同樣適用。因此,另一個人也將背叛而不管你如何做。這樣,你們將是雙方背叛,只能一起坐牢很久,這比你們雙方合作所能得到的「獎勵」(只需短期服刑)差很多。個體的理性導致雙方得到的比可能得到的少,這就是「困境」。啟示1:在「囚徒困境」中表現最好的策略直接取決於對方採用的策略,特別是取決於這個策略為發展雙方合作留出多大的餘地。獨立於對方所用策略之外的最好決策規則是不存在的。啟示2:「囚徒困境」是一些非常普遍而有趣的情形的簡單抽象。在這些情形中,從個人的角度來說,背叛是最好的選擇,但雙方背叛會導致不甚理想的結果出現。選1還是選2這個問題不僅讓商人們苦惱不堪,也同樣折磨著商學院的學生們。一位教授讓自己班上的27名學生進行一個博弈,而這個博弈會把他們帶入「囚徒困境」。假設每一個學生都擁有一家企業,現在他必須決定自己應該1,生產高質量商品來幫助維持較高價格,還是2,生產假貨來通過別人所失換取自己所得。根據願意選擇1的學生總數,將收入分給每個學生。這是一個「事先設計好」的博弈,目的是確保每個選擇2的學生總比選擇1的學生多得50美分,這個設定當然有現實意義,生產假貨成本要比高質量商品低。不過,選擇2的人越多,他們的總收益就會越少,這個假設也有道理:假貨太多,就會使市場混亂,產品信譽降低。假設全體27名學生一開始都打算選擇1,那麼他們各得1.08美元。假設有一個人打算偷偷改變決定,選擇2,那麼,選擇1的學生就有26名,各得1.04美元比原來少了4美分,但那個改變主意的學生就能得到1.54美元比原來多了46美分。實際上,不管最初選擇1的學生總數是多少,結果都是一樣,選擇2是一個優勢策略。每一個改選2的學生都會多得46美分,同時會使他的26個同學分別少得4美分,結果全班收入會少得58美分。等到全體學生一致選擇自私的策略,儘可能使自己的收益達到最大,他們將各得50美分。反過來,假如他們聯合起來,協同行動,不惜將個人的收益減至最小,他們將各得1.08美元。你會怎麼抉擇?演練這個博弈的時候,起初不允許集體討論,後來允許一點討論,以便達成「合謀」,結果願意合作而選擇1的學生總數從3到14不等。在最後的一次帶有協議的博弈里,選擇1的學生總數是4,全體學生的總收益是15.82美元,比全體學生成功合作可以得到的收益少了13.34美元。「我這輩子再也不會相信任何人了。」領導合謀的學生這樣嘟囔。那麼,他自己又是怎麼選擇的呢?「噢,我選了2。」他答道。政治家們也會變成同樣的困境中的囚徒。1984年,大多數人都很明白,美國聯邦預算赤字實在太高了。裁減必要的巨額開支在政治上並不可行,因此,大幅增稅應該是不可避免的。不過,誰願意擔當政治領導角色帶頭主張這麼做呢?民主黨總統候選人沃爾特·蒙代爾想要在自己的競選活動當中為這麼一個政策轉變製造聲勢,卻被羅納德·里根打得落花流水,因為里根許諾絕不加稅。里根當選之後,這個議題陷入僵局,無論你怎麼劃分政治派別,民主黨對共和黨,眾議院對參議院,還是政府對國會,各方都希望把提出加稅的主動權推給對方。雙方都知道,聯合起來共同倡議加稅和削減開支,可以共同分享榮譽,分擔譴責。這麼做與同時堅守被動,眼看巨額赤字上升而無所作為相比,顯然會對整個國家更有利,即便對他們自己的政治生涯從長期而言也會有好處。反過來,假如自己提出這樣的政策,而對方堅守被動局面,並不附和,自己就會落得最糟糕的下場。從各方的角度看,最好的結果在於,對方有人提出加稅和削減開支,並因此不得不付出政治代價。我們可以將這個情況變成一個博弈。雙方分別是民主黨和共和黨。為了表示誰更加傾向於怎麼做,顯而易見,對每一方而言,保持被動是一個優勢策略。而這正是真實發生的情況:這一屆國會根本沒有作出任何加稅決定。這就是為什麼美國是世界上最富有的國家,卻同時又是最大的債務國的原因。啟示:這些情景使我們回想起尤塞里安在約瑟夫·海勒的小說《第22條軍規》當中的境遇。故事的背景是:第二次世界大戰勝利在望,可是為了給自己撈取功勞,一個飛行大隊的指揮官沒完沒了地提高下屬的任務定額,弄得所有人都人心惶惶。投彈手尤塞里安不想成為勝利前夕最後一批犧牲者,千方百計逃避執行任務。他的上級軍官問:「可是,假如我方士兵都這麼想呢(意思是「你不扛槍,我不扛槍,誰來保衛家」)?」可尤塞里安答道:「那我若是不這麼想,豈不就成了一個大傻瓜?」學生與囚犯「囚徒困境」不僅可以解釋政治、經濟領域的競爭,在廣闊的社會生活中,這一困境的影響也隨處可見。例如,我國目前的基礎教育,可以說就是一個「囚徒困境」。最近10多年來,應試教育的弊端已經為社會公認,目前要求「減負」的不僅是中小學生和學生家長,也是教育專家和教育管理部門,也可以說是全社會的呼聲。教育管理部門這幾年做了一系列的工作,但收效甚微,並沒有從根本上解決問題。很少有人否認,學校不斷給學生增加負擔是目前教育的實際狀況。同樣,大家普遍認為呆板僵化的應試教育扼殺了學生的創造性。無論是專家還是家長,都在呼籲改變應試教育的模式。但是無論你是否意識到教育有問題,你的小孩都必須接受這個教育。如果沒有改變整體性的教育體制,個別人、個別學校、個別地方單獨改變都可能使其付出代價。每個家長都會這樣想:儘管這種教育不好,但是其他小孩採取的是這種教育,衡量標準(如中考、高考)也是依據這種教育,我的小孩如不這樣做,在競爭方面就會吃虧。因此,每個孩子和家長已經不知不覺地進入了一個囚徒困境。如果我國現有的考試製度沒有改變,「減負」就是空談。現在假設國家嚴格規定:所有的學生都「減負」,少留作業,不補課、不做其他的練習題,是否能解決問題?可以肯定的是,規定即使一時有效,但效果會很快消失,最終極可能的結果是規定成了一紙空文,學生還是要背大書包、拚命做課外作業和各種練習題。可以說,減負的狀態是不穩定的,而「增負」的狀態是穩定的均衡。原因就是,目前教育的博弈結構規定了各種行動或行為的收益或好處:獲得高分的會進入好的初中、高中,進入好的初中、高中的學生可以考高分進入好的大學。而對於老師和學校來說,學生的升學率高意味著名利雙收、飯碗牢靠;如果整個規則都傾向「增負」,「負」又如何減得下來?從理論上說,擺脫「增負」的囚徒困境的惟一辦法是改變教育的博弈結構,即改變博弈規則或遊戲規則,讓「全面發展」的學生獲得更多的機會。可是要在實踐中達到這個效果,卻又困難重重,除了教育投入不足、師資水平不高等現實問題,最大的難點,是如何找到一個更科學、合理,同時又能保證公平的新的「遊戲規則」。至少在現在,這還是個沒有答案的問題。啟示:管理的目的不是讓每個人做到最好,而是避免內耗過多。煙草商為何不反對禁止煙草广告從上面的例子來看,一旦陷入「囚徒困境」,其中任何一方都無法獨善其身,即使雙方都有合作意願,也很難達成合作。那麼,有什麼辦法可以使我們逃脫「困境」?稍後將詳細討論這個問題,這裡只說一個外力干預打破困境的例子,它具有一些背謬甚至滑稽的色彩。1971年,在「禁煙運動」的聲勢下,美國國會通過了禁止在電視上做煙草广告的法律。令許多人奇怪的是,這一回財大氣粗的煙草公司反應相當平靜,並沒有動用其龐大的社會資源和影響力阻止這個法律的通過。而且,後來的統計資料表明:儘管煙草广告因受到限制而減少,可是煙草公司的利潤卻提高了。你是否知道煙草公司為什麼不反對、甚至可能還歡迎這項法律?因為這個禁令使他們從「囚徒困境」中解放了出來。煙草行業同樣競爭激烈,為了爭奪市場,各大煙草公司都必須大做廣告。為此,它們每年都要花費巨額廣告費用,這無疑降低了它們的利潤水平。也就是說,如果煙草公司都不做廣告,它們的利潤要更高。可是,如果其中一家公司不做廣告,它的市場份額就會被其他公司搶走。這正是一個囚徒困境:你合作,對方不合作,你就吃虧了。在這種情況下,做廣告就是優勢策略。那麼,煙草公司能否達成都不做廣告的協議呢?不能,因為誰遵守協議,就很可能被對手耍弄。現在好了,煙草公司做不到的,國家為它做了:法律起到了協議的作用,而政府承擔了監督的成本,借用過去的一句話說,是「起到了階級敵人想起而起不到的作用」,煙草公司又何樂不為呢?你可能會說:廣告不但有競爭的作用,也有開拓市場的作用,在這方面,煙草公司不是也有損失嗎?當然如此。但是注意這個法律是有限的,被禁止的只是電視廣告,而不包括其他媒體;而且只禁止在美國做電視廣告,而不包括其他國家。(幾年前,我們不是都看過氣勢不凡的「這裡就是萬寶路的世界」這個電視廣告嗎?)對於已經比較成熟的市場,像香煙這樣的商品,廣告的開拓作用是有限的。現在,美國煙草公司已經把開拓的目標放在了廣大的國外市場。一定是壞事嗎「囚徒困境」確實揭示了自私對合作的破壞作用,但是正如「有一利必有一弊」這句話,「囚徒困境」給我們帶來的也並不全是壞消息。作為一個比喻,我們會為囚犯不能合作而遺憾;可是如果它發生在現實中,我們就巴不得他們不能合作。如果兩個危險的罪犯通過合作逃脫了法律制裁,一定會給社會造成更大的危害。同樣,如果商家通過合謀控制物價,我們就不能享受合理的價格,這也會大大增加人們的消費成本,降低人們的生活水平。從經濟的角度來看,如果幾個大企業聯手或勾結起來形成對行業的壟斷,謀求最大利潤,那麼它們結成的聯盟稱為「卡特爾」。卡特爾因為由自主的企業組成,所以很不穩定。以產量競爭來說,組成卡特爾,就要討價還價,達成限制產量的協定,總產量因為協定的限制降低了,價格也就會上去,可能比結成卡特爾以前高出很多。這時候,誰要是偷偷地擴大產量,他可能佔到很大的便宜。卡特爾聯盟和組成聯盟的成員之間的關係,不是上下級的關係,不是誰服從誰的關係。卡特爾的成員都是獨立的經濟主體,只不過為了利益關係走到一起來了。偷偷違反協議增加產量或提供優惠會撈到很大的便宜,這就促使一些成員違反協議。所以說,卡特爾本身就提供了瓦解卡特爾的激勵。在人類經濟活動中,除了石油輸出國組織歐佩克一度比較成功以外,卡特爾成功的例子實在很少。歐佩克之所以比較成功,很大的原因在於它的最大的成員國沙烏地阿拉伯「自律」較嚴。石油產量最大的沙烏地阿拉伯自律嚴了,在一段時間內就可以避免其他成員違反協議,造成危害卡特爾的結果。沙烏地阿拉伯為什麼自律較嚴,我們在後面將會談到。從政府管制的角度來看,卡特爾在許多情況下是非法行為。例如近年來的「家電」大戰,電視、空調等價格一路下跌,殘酷的價格戰讓家電企業吃不消,幾年前,9家企業曾經一起協議制定最低價格,規定什麼類型的家電至少要賣多少錢,不許把價格降到比協議規定的價格還低的水平,其目的無非是不要競相降價,以免大家的利潤都下降。這就是卡特爾行為。很快,國家計委就發出文件,指出該決議非法。這主要是不許企業聯手抬高商品價格損害消費者的利益。發達國家對壟斷現象和卡特爾現象的限制往往更加嚴厲。最典型的例子是20世紀80年代,經過多年的辯論和漫長的立法程序,美國把原來壟斷電話通訊市場的AT&T公司強行分割為幾個公司。分割以後,由於公司之間的競爭,電話服務的價格很快就下降了一半,再加上競爭激勵出來的技術進步,現在用電話卡從美國往中國打電話一分鐘只要幾美分。從原則上說,政府鼓勵企業之間的競爭,因為企業競爭會給廣大消費者帶來很大的好處。比如我國電話服務市場長期是壟斷的,所以直到前幾年,在我國許多地方,裝一部電話不僅要花三四千元,而且還要排隊等待不少時間才能裝上。但是在許多發達國家,如果你要裝電話,只需通知電話公司,馬上就會給你裝好,完全不用繳納什麼安裝費。由於競爭,如果你把選擇的電話服務從原來的公司撤出來轉到另一家公司,新的公司還會給你獎勵,比如說獎勵你30分鐘的國內長途電話費,再加一件T恤什麼的。現在,我國電話服務市場開放競爭,消費者固然馬上得到實惠,服務水平也在明顯上升。再如過去我國行動電話市場原來基本上是一家壟斷,當時購置、使用一部行動電話的費用高達一兩萬元,是典型的「奢侈品」。後來打破了這一壟斷,允許幾家企業共同經營,行動電話的費用很快就降到千元左右,幾乎成了人手一部的「必需品」。初看起來,鼓勵競爭似乎對企業不利,使企業不容易賺錢。但是只有這樣,才能激勵企業改善管理,開發技術,努力以較低的成本生產質量較好的產品。提高企業的市場競爭力。競爭力不是天生就有的,它本身就是競爭的結果。若不首先讓我們的企業在國內市場好好競爭,他們在國際市場就不可能有強大的競爭力。啟示:曾經有兩個飢餓的人,他們從一位智者那裡得到了一根魚竿和一簍鮮魚,得到那簍鮮魚的人就在原地把魚煮熟了一口氣吃完,解決了飢餓問題,可是很快就又感到肚內空空,最終餓死在了空空的魚簍旁。而另一個得到魚竿的人則提著魚竿向遙遠的大海走去,當他終於來到了大海邊的時候,他也用盡了自己的最後一點力氣。不久之後,同樣是兩個飢餓的人,他們也從智者那裡得到了同樣的一根魚竿和一簍鮮魚。不同的是他們並沒有分頭行動,而是一起去尋找遙遠的大海。每到飢餓的時候,他們就會從魚簍中拿出一條魚來吃。當他們終於來到了大海邊的時候,這兩個人就拿著那根魚竿開始了靠捕魚為生的日子。第2章 優勢、劣勢與均衡當你身處類似「囚徒困境」這樣的同時行動的博弈中,你的最佳策略是什麼?決定勝負的因素又是什麼?雙方的策略選擇往往是有跡可遁的,並形成某種「定式」——即均衡。新聞大戰與博弈策略勢者,因利而制權也。——《孫子兵法》前面所引的這句話的意思就是:所謂(有利的)形勢,即根據對我有利的情況採取措施和行動。當你身處類似「囚徒困境」這樣的同時行動的博弈(跟棋牌之類的交替行動博弈不同)你的最佳策略是什麼?決定勝負的因素又是什麼?雙方的策略選擇往往是有跡可循的,並形成某種「定式」——即均衡。為了說明博弈如何達到「均衡」的結果,我們可以通過兩份雜誌(以美國的兩大雜誌《時代》和《新聞周刊》為例)來演示這一過程。每個星期,《時代》和《新聞周刊》都會暗自較勁,要做出最引人注目的封面故事。一個富有戲劇性或者饒有趣味的封面,可以吸引站在報攤前的潛在買主的目光。因此,每個星期,《時代》的編輯們一定會舉行閉門會議,選擇下一個封面故事。他們這麼做的時候,很清楚在此時《新聞周刊》的編輯們也在關起門來開會,選擇下一個封面故事。反過來,《新聞周刊》的編輯們也知道《時代》的編輯們正在做同樣的事情,而《時代》的編輯們也知道《新聞周刊》的編輯們知道這一點……這兩家新聞雜誌投入了一場策略博弈。由於《時代》與《新聞周刊》的行動是同時進行的,雙方不得不在毫不知曉對手決定的情況下採取行動。等到彼此發現對方做了什麼,再想做什麼改變就太遲了。當然,這個星期的輸家下個星期很可能竭力反撲,不過,等到那時,說不定已經出現了一個完全不同的新的故事模式,開始了一場完全不同的博弈。要注意這種同時進行的博弈與相繼(一先一後)行動的博弈所要用到的策略思維和行動是完全不同的。對於像下棋這樣的一人一步的相繼行動的博弈,每個參與者都必須向前展望,估計對手的意圖,從而倒後推理,決定自己這一輪應該怎麼走。這是一條線性的推理鏈:「假如我這麼做,他就會那麼做——若是那樣,我會這麼反擊」,依此類推。也就是說,你怎麼走,完全取決於對手的上一步行動。而在同時行動的博弈里,沒有一個參與者可以在自己行動之前得知另一個參與者的整個計劃。在這種情況下,互動推理不是通過觀察對方的策略進行,而是必須通過看穿對手的策略才能展開。要想做到這一點,單單假設自己處於對手的位置會怎麼做還不夠。即便你那樣做了,你只會發現,你的對手也在做同樣的事情,即他也在假設自己處於你的位置會怎麼做。因此,每一個人不得不同時擔任兩個角色,一個是自己,一個是對手,從而找出雙方的最佳行動方式。與一條線性的推理鏈不同,這是一個循環——「假如我認為他認為我認為……」,訣竅在於怎樣破解這個循環。啟示:有一個著名的寓言:兩個人都在喝水,都喝了半杯水,一位說:「我已經喝了半杯。」另一位說:「我還有半杯水沒有喝。」他們好像說的是一回事,然而聰明人都可以聽出他們說的又不是一回事,就像有些人說:「我的錢已經用了一半。」而另一些人說:「我的錢還有一半沒有用。」同時行動的優勢策略你怎樣才能看穿所有那些錯綜複雜而又看不見的策略呢?首先,你不要把其他參與者的未知行動視做像天氣那樣,具有與個人無關的不確定性。上班之前,你可能收聽天氣預報,知道今天是否下雨,你會利用這個信息去決定要不要帶一把雨傘去上班。當然,你帶不帶傘,絲毫不能影響天下不下雨。但為封面故事而作決定的概率則完全是另外一回事。區別在於,《時代》的編輯對《新聞周刊》有一個非常中肯的了解——另一個雜誌的編輯與天氣不同,他們是策略的博弈參與者,就跟《時代》的編輯自己一樣。即便一個編輯不可能真的觀察到另一個雜誌的決定,他也可以通過另一個雜誌的視角思考這個問題,嘗試確定它現在一定在做什麼。我們可以提供一個單一的、統一的原理,為相繼行動(即有先有後)的博弈確定最佳策略。這就是向前展望,倒後推理。在這裡,事情不會那麼簡單。不過,關於同時行動必不可少的思維方式的思考可以總結為指導行動的三個簡單法則。反過來,這些法則又基於兩個簡單概念:優勢策略與均衡。舉個簡單的例子:你是一名足球前鋒,你和隊友形成了二打一的局面,你面對著對方的後衛,你可以選擇帶球突破,也可以選擇傳球給隊友,一般情況下,傳球過人的成功率更大,那麼傳球就是你的優勢策略。即某些時候它勝於其他策略,且任何時候都不會比其他策略差。一般而言,假如一個球員有某一做法,無論其他球員怎麼做,這個做法都會高出一籌,那麼這個球員就有一個優勢策略。假如一個球員擁有這麼一個策略,他的決策就會變得非常簡單;他可以選擇這個優勢策略,完全不必擔心其他對手怎樣行事。因此,尋找優勢策略是每一個人的首要任務。回到《時代》對《新聞周刊》的例子,假定本周有兩個大新聞:一是國會就預算問題吵得不可開交;二是發布了一種據說對艾滋病有特效的新葯。編輯們選擇封面故事的時候,首要考慮的是哪一條新聞更能吸引報攤前的買主(訂戶則無論採用哪一條新聞封面故事都會買這本雜誌)。在報攤前的買主當中,假設30%的人對預算問題感興趣,70%的人對艾滋病新葯感興趣。這些人只會在自己感興趣的新聞變成封面故事的時候掏錢買雜誌;假如兩本雜誌用了同一條新聞做封面故事,那麼感興趣的買主就會平分兩組,一組買《時代》,另一組買《新聞周刊》。現在,《時代》的編輯可以進行如下推理:「假如《新聞周刊》採用艾滋病新葯做封面故事,那麼,假如我採用預算問題,我就會得到整個『預算問題市場』(即全體讀者的30%);假如我採用艾滋病新葯,我們兩家就會平分『艾滋病新葯市場』(即我得到全體讀者的35%),因此,艾滋病新葯為我帶來的收入就會超過預算問題。假如《新聞周刊》採用預算問題,那麼,假如我採用同樣的故事,我會得到15%的讀者,假如我採用艾滋病新葯,就會得到70%的讀者;這一次,第二方案同樣會為我帶來更大的收入。因此,我有一個優勢策略,就是採用艾滋病新葯做封面。無論我的對手選擇採用上述兩個新聞當中的哪一個,這一策略都會比我的其他策略更勝一籌。」啟示:一家尖端科技公司的某部經理,詢問副總工程師新產品的市場成功率。他得到的答案是「大約50%」,這位經理回答說:「太高了,最好設定在30%,否則,我們會因太保守而不敢放手做。」當對手有優勢策略時在這個博弈里,雙方都有一個優勢策略。以策略觀點來看,各方均有一個優勢策略的博弈是最簡單的一種博弈。雖然其中存在策略互動,卻有一個可以預見的結局:全體參與者都會選擇自己的優勢策略,完全不必理會其他人會怎麼做。但這一點並不會降低參與或者思考這種博弈的趣味性。在囚徒困境中,兩個參與者都有一個優勢策略,只不過這股壓倒一切的力量最終將他們引向了一起倒霉的結局。這就提出了一個很有意思的問題:參與者怎樣合作才能取得一個更好的結果?有時候,某參與者有一個優勢策略,其他參與者則沒有。我們只要略微修改一下《時代》與《新聞周刊》的封面故事大戰的例子,就可以描述這種情形。假設全體讀者略偏向於選擇《時代》。假如兩個雜誌選擇同樣的新聞做封面故事,喜歡這個新聞的潛在買主當中有60%的人選擇《時代》,40%的人選擇《新聞周刊》。對於《時代》,艾滋病新葯仍然是優勢策略,但對於《新聞周刊》就不再是了,因為《時代》的優勢策略是選擇艾滋病新葯這個主題,如果它也做同樣選擇,那麼只能得到28%的讀者,小於選擇預算問題的30%。換言之,《新聞周刊》的最佳選擇不再與《時代》的策略無關。假如《時代》選擇艾滋病新葯,《新聞周刊》選擇預算問題就能得到更好的銷量,對於《新聞周刊》,預算問題市場總比新葯市場要大。《新聞周刊》的編輯們不會知道《時代》的編輯們將會選擇什麼,不過他們可以分析出來。因為《時代》有一個優勢策略,那一定就是他們的選擇。因此,《新聞周刊》的編輯們可以很有把握地假定《時代》已經選了艾滋病新葯,並據此選擇自己的最佳策略,即預算問題。由此可見,只有一方擁有優勢策略的博弈其實也非常簡單。擁有優勢策略的一方將採用其優勢策略,另一方則針對這個策略採用自己的最佳策略。優勢策略與對手策略無關現在,既然我們已經介紹了優勢策略的概念,就有必要強調可用來確定什麼不是優勢策略的兩點特徵。人們很容易就會弄錯,不知道優勢策略的優勢究竟是對什麼而言的。「優勢策略」的優勢是指你的這個策略對你的其他策略佔有優勢,而不是對你的對手的策略佔有優勢,無論對手採用什麼策略。某個參與者如果採用優勢策略,就能使自己獲得比採用任何其他策略更好的結果。回顧封面大戰的例子,《時代》和《新聞周刊》都有一個優勢策略,但雙方都不可能得到比對方更高的銷量。另一個常見的誤解在於,一個優勢策略必須滿足一個條件,即採用優勢策略得到的最壞結果也要比採用另外一個策略得到的最佳結果略勝一籌。在前面講到的例子里,所有優勢策略湊巧都滿足這個條件。按照最初設定的條件,《時代》假如採用艾滋病新葯做封面故事,最壞的結果是得到35%的市場份額;他們若採用預算問題做封面故事,可能得到的最佳結果是30%的市場份額。但這並非優勢策略的一個普遍特徵。現在讓我們想像一下《時代》和《新聞周刊》之間爆發了一場價格戰。假設每本雜誌的製作成本是l美元,且售價只有兩個可能的價位選擇,分別是3美元(意味著每本利潤為2美元)和2美元(意味著每本利潤為l美元)。假設顧客永遠傾向於選擇價格較低的雜誌,且在雜誌價格相同的時候兩種雜誌各得一半讀者。雜誌定價3美元的時候,讀者總數是500萬;雜誌價格降到2美元,讀者總數將升到800萬。這時,你可以輕易算出《時代》在四種可能出現的價格組合里將會獲得多少利潤,即如果你們都是3美元,利潤都是500萬;一方降價至2美元,獨得800萬,另一方分文不得;如果雙方都降,每一方利潤都是400萬。有點像「囚徒困境」是不是?的確,在囚徒困境中,雙方的優勢策略都是招供,在這裡都是降價。《時代》的優勢策略是定價2美元(《新聞周刊》亦如此)。《時代》採用這個優勢策略可能得到的最壞結果是贏利400萬美元。但是,採用另外一個策略可能得到的最佳結果將超過這一數字,達到500萬美元。問題是比較這兩個數字毫無意義。500萬美元的數字是在兩本雜誌同時定價3美元的時候出現的;不過,假如這時《時代》把價格降到2元,利潤還會更高,達到800萬美元。我們可以把這些例子歸納為一個指導同時行動的博弈的法則。即:假如你有一個優勢策略,請照辦。不要擔心你的對手會怎麼做。假如你沒有一個優勢策略,但你的對手有,那麼就當他會採用這個優勢策略,相應選擇你自己最好的做法。提醒一句:我們已經確立了同時行動的博弈的優勢策略的概念。若是換了相繼行動的博弈,採用優勢策略的時候就要格外留神。因為策略互動的本質已經改變,優勢策略的概念也會完全不同。假設我們說你有一個優勢策略,無論你的對手選擇怎麼做,你按照這個策略做都比採用其他策略更好。若是相繼行動,而你的對手先行,你就應該一直選擇自己的優勢策略。正如我們已經說過的那樣,這是你對你的對手每一個行動的最佳對策,因此也是對現在他選擇的這個特定行動的最佳對策。但是,假如你先行,你就不會知道你的對手將會採取什麼行動。他會觀察你的選擇,同時作出自己的決定,因此你有機會影響他的行動。某些情況下,若是採用優勢策略以外的策略,你可能更有效地施加這種影響。啟示:馬太效應:凡是少的,連他僅有的也奪過來;凡是多的,就加給他,讓他更多。在各個領域,馬太效應暢行無阻——你不在上面,就在下面。而一旦成功地利用它,就可以達到事半功倍的效果。追求最佳,避免最差不是所有博弈都有優勢策略,哪怕這個博弈只有一個參與者。實際上,優勢與其說是一種規律,不如說是一種例外。雖然出現一個優勢策略可以大大簡化行動的規則,但這些規則卻並不適用於大多數現實生活中的博弈。這時候我們必須用到其他原理。一個優勢策略優於其他任何策略,同樣,一個劣勢策略則劣於其他任何策略。假如你有一個優勢策略,你可以選擇採用,並且知道你的對手若是有一個優勢策略他也會照辦;同樣,假如你有一個劣勢策略,你應該避免採用,並且知道你的對手若是有一個劣勢策略他也會規避。假如你只有兩個策略可以選擇,其中一個是劣勢,那麼另一個一定是優勢策略。因此,與選擇優勢策略做法完全不同的規避劣勢策略做法,必須建立在至少一方擁有至少三個策略的博弈的基礎之上。在你沒有優勢策略的情況下,你要做的就是剔除所有劣勢策略,不予考慮。如此一步一步做下去。假如在這麼做的過程當中,在較小的博弈里出現了優勢策略,應該一步一步挑選出來。假如這個過程以一個獨一無二的結果告終,那就意味著你找到了參與者的行動指南以及這個博弈的結果。即便這個過程不會以一個獨一無二的結果告終,它也會縮小整個博弈的規模,降低博弈的複雜程度。利用優勢策略方法與劣勢策略方法進行簡化之後,整個博弈的複雜度已經降到最低限度,不能繼續簡化,而我們也不得不面對循環推理的問題。你的最佳策略要以對手的最佳策略為基礎,反過來從你的對手的角度分析也是一樣。接下來我們將會介紹解開這個循環的技巧,最終走出這個循環。博弈的均衡——納什均衡我們已經找到了一個策略組合,其中,各方的行動就是針對對方行動而確定的最佳對策。一旦知道對方在做什麼,就沒人願意改變自己的做法。博弈論學者把這麼一個結果稱為「均衡」。這個概念是由普林斯頓大學數學家約翰·納什(也就是電影《美麗心靈》的主人公)提出的,因此被稱為「納什均衡」。納什均衡是博弈分析中的重要概念。1950年,還是一名研究生的納什寫了一篇論文,題為《n人博弈的均衡問題》,該文只有短短一頁紙,可就這短短一頁紙成了博弈論的經典文獻。在這篇論文中,納什給出了博弈均衡的定義,即納什均衡。那麼,什麼是納什均衡呢?簡單說就是,一策略組合中,所有的參與者面臨這樣的一種情況:當其他人不改變策略時,他此時的策略是最好的。也就是說,此時如果他改變策略,他的支付將會降低。在納什均衡點上,每一個理性的參與者都不會有單獨改變策略的衝動。在囚徒困境中存在惟一的納什均衡點,即兩個囚犯均選擇「招認」,這是惟一穩定的結果。有些博弈的納什均衡點不止一個。如下述「夫妻博弈」(或稱性別之戰)中有兩個納什均衡點。丈夫和妻子商量晚上的活動。丈夫喜歡看拳擊,而妻子喜歡欣賞歌劇。但兩人都希望在一起度過夜晚。在這個「夫妻博弈」中有兩個納什均衡點:(歌劇,歌劇),(拳擊,拳擊)。在有兩個或兩個以上納什均衡點的博弈中,其最後結果難以預測。在「夫妻博弈」中,我們無法知道,最後結果是一同欣賞歌劇還是一起去看拳擊。納什均衡是博弈論中的重要概念,同時也是經濟學的重要概念。諾貝爾經濟學獎獲得者薩繆爾森有一句幽默的話:你可以將一隻鸚鵡訓練成經濟學家,因為它所需要學習的只有兩個詞:供給與需求。博弈論專家坎多瑞引申說:要成為現代經濟學家,這隻鸚鵡必須再多學一個詞,這個詞就是「納什均衡」。由此可見納什均衡在現代經濟學中的重要性。納什均衡不僅對經濟學意義重大,對其他社會科學意義也同樣重大。啟示:通俗地說,納什均衡含義就是:給定你的策略,我的策略是最好的策略;給定我的策略,你的策略也是你最好的策略。即雙方在對方給定的策略下不願意調整自己的策略。納什均衡有什麼用納什的想法成為我們指導同時行動博弈的最後一個法則的基礎。這個法則如下:走完尋找優勢策略和剔除劣勢策略的捷徑之後,下一步就是尋找這個博弈的均衡。我們還要解釋一下這個法則。為什麼一個博弈的參與者非得達到這麼一個結局呢?我們可以說出好幾個理由。沒有一個理由本身就有足夠的說服力,不過,只要把幾個理由結合起來,就能形成一個有力的答案。首先,存在避免循環推理的必要,因為循環推理幫不上忙。均衡在沒完沒了的「我知道他知道我知道……」的循環里是穩定不變的,這使參與者對其他人的行動的估計能保持連貫性。各方正確預計別人的行動,並且確定自己的最佳對策。均衡策略的第二個好處出現在零和博弈中。在這種博弈里,參與者的利益嚴格相悖。你的對手不能通過引誘你採取一個均衡策略而得到任何好處。你已經充分考慮到他們對你正在做的事情會有什麼樣的最佳對策。第三個理由是,均衡方法注重實效。要想知道梨子的滋味,就要吃一吃。我們將會利用均衡方法討論許多博弈。希望讀者來檢驗它對博弈結果的預測以及這種思維方式產生的行為指導方針。相信這麼做會使我們的分析更有意思,比抽象地討論均衡方法的優點更有意義。最後,可能存在一個對均衡概念的誤解,希望各位可以避免。當我們說博弈的結果是均衡,並不一定是對參與者最有利的結果,更不意味著是對整個社會作為一個整體而言最有利的結果。有利或者不利的評價永遠屬於另外一個問題,答案視各個案例的具體情況而各有不同。在經濟學中,均衡意即相關量處於穩定值。在供求關係中,某一商品市場如果在某一價格下,想以此價格買此商品的人均能買到,而想賣的人均能將商品賣出去,此時我們就說,該商品的供求達到了均衡。此時的價格可稱之為均衡價格,產量稱之為均衡產量。均衡分析是經濟學中的重要分析。那麼什麼是博弈論的均衡呢?所謂博弈均衡,它是一穩定的博弈結果。均衡是博弈的一結果,但不是說博弈的結果都能成為均衡。博弈的均衡是穩定的,因而是可以預測的。納什均衡是一最常見的均衡。它的含義是:在對方策略確定的情況下,每個參與者的策略都是最好的,此時沒有人願意先改變自己的策略。在上面的「買——賣」的博弈中,可以解釋為什麼在現實中討價還價後買賣能做成的原因,因為這對雙方來說都是最優選擇。同時在「買——賣」博弈中,其均衡對雙方來說是全局最優的。警察與小偷是不是所有的博弈均存在納什均衡點呢?不一定存在純策略納什均衡點——所謂純策略是指參與者在他的策略空間中選取惟一確定的策略。但至少存在一個混合策略均衡點——所謂混合策略是指參與者採取的不是惟一的策略,而是其策略空間上的概率分布。這就是納什於1950年證明了的納什定理。我們下面將在「警察與小偷」的博弈中給出混合策略的說明。在西部片里,我們常能看到這樣的故事:某個小鎮上只有一名警察,他要負責整個鎮的治安。現在我們假定,小鎮的一頭有一家酒館,另一頭有一家銀行。再假定該地有一個小偷,要實施偷盜。因為分身乏術,警察一次只能在一個地方巡邏;而小偷也只能去一個地方。假定銀行需要保護的財產價格為2萬元,酒館的財產價格為1萬元。若警察在某地進行巡邏,而小偷也選擇了去該地,就會被警察抓住;若警察沒有巡邏的地方而小偷去了,則小偷偷盜成功。警察怎麼巡邏才能使效果最好?一個明顯的做法是,警察對銀行進行巡邏,這樣,警察可以保住2萬元的財產不被偷竊。可是如此,假如小偷去了酒館,偷竊一定成功。這種做法是警察的最好做法嗎?有沒有對這種策略改進的措施?這個博弈沒有純策略納什均衡點,而有混合策略均衡點。這個混合策略均衡點下的策略選擇是每個參與者的最優(混合)策略選擇。對於這個例子,對於警察的一個最好的做法是,警察抽籤決定去銀行還是酒館。因為銀行的價值是酒館的兩倍,所以用兩個簽代表銀行,比如如果抽到1、2號簽去銀行,抽到3號簽去酒館。這樣警察有2/3的機會去銀行進行巡邏,1/3的機會去酒館。而小偷的最優選擇是:以同樣抽籤的辦法決定去銀行還是去酒館偷盜,只是抽到1、2號簽去酒館,抽到3號簽去銀行,那麼,小偷有l/3的機會去銀行,2/3的機會去酒館。警察與小偷之間的博弈,如同小孩子之間玩「剪刀石頭布」的遊戲,在這樣一個遊戲中,不存在純策略均衡,對每個小孩來說,自己採取出「剪刀」、「布」還是「石頭」的策略應當是隨機的,不能讓對方知道自己的策略,哪怕是「傾向性」的策略。如果對方知道你出其中一個策略的「可能性」大,那麼你在遊戲中輸的可能性就大。因此,每個小孩的最優混合策略是採取每個策略的可能性是l/3。在這樣的博弈中,每個小孩各取三個策略的1/3是納什均衡。由此可見:純策略是參與者一次性選取的,並且堅持他選取的策略;而混合策略是參與者在各種備選策略中採取隨機方式選取的。在博弈中,參與者可以改變他的策略,而使得他的策略選取滿足一定的概率。當博弈是零和博弈時,即一方所得是另外一方的所失時,此時只有混合策略均衡。對於任何一方來說,此時不可能有純策略的佔優策略。啟示1:沒有把真正的問題找出來就盲目採取行動,是最愚蠢的做法。能夠找出問題,已經可以說是把問題解決一半了。啟示2:解決問題的公式:(1)找出問題發生的原因;(2)分辨情報的價值;(3)徹底推行解決方案;(4)觀察事情進行得是否順利。任何事情都看似很難,實質不難;任何事情都比你預期的更令人滿意;任何事情都能辦好,而且是在最佳的時刻辦好——麥可斯韋爾定律有助你走出陰霾。鬥雞博弈的難局試想有兩隻公雞遇到一起,每隻公雞有兩個行動選擇:一是退下來,一是進攻。如果一方退下來,而對方沒有退下來,對方獲得勝利,這隻公雞則很丟面子;如果對方也退下來雙方則打個平手;如果自己沒退下來,而對方退下來,自己則勝利,對方則失敗;如果兩隻公雞都前進,那麼則兩敗俱傷。因此,對每隻公雞來說,最好的結果是,對方退下來,而自己不退,但是此時面臨著兩敗俱傷的結果。兩者如果均選擇「前進」,結果是兩敗俱傷,兩者均獲得-2的支付;如果一方「前進」,另外一方「後退」,前進的公雞獲得1的支付,贏得了面子,而後退的公雞獲得-l的支付,輸掉了面子,但沒有兩者均「前進」受到的損失大;兩者均「後退」,兩者均輸掉了面子獲得-1的支付。當然這些數字只是相對的值。這個博弈有兩個納什均衡:一方前進,另一方後退。但關鍵是誰進、誰退?一個博弈,如果有惟一的納什均衡點,那麼這個博弈是可預測的,即這個納什均衡點就是一事先知道的惟一的博弈結果。但是如果一博弈有兩個或兩個以上的納什均衡點,則無法預測出一個結果來。因此,我們無法預測鬥雞博弈的結果,即不能知道誰進誰退,誰輸誰贏。用這個博弈來解釋美蘇兩個超級大國之間的古巴導彈危機,是最合適不過的了。面對美國的反應,蘇聯面臨著是將導彈撤回國還是堅持部署在古巴的選擇?而對於美國,則面臨著是挑起戰爭還是容忍蘇聯的挑釁行為的選擇?也就是說,這兩隻大公雞均在考慮採取進的策略還是退的策略?戰爭的結果當然是兩敗俱傷,而任何一方退下來(而對方不退)則是不光彩的事。結果是蘇聯將導彈從古巴撤了下來,做了丟面子的「撤退的雞」。美國堅持了自己的策略,做了「不退的雞」。當然,為了給蘇聯一點面子,同時也擔心蘇聯堅持不退而發生美蘇戰爭——這是美國不願意看到的,美國象徵性地從土耳其撤離了一些導彈。古巴導彈危機是冷戰期間美蘇兩霸之間發生的最嚴重的一次危機。這就是美國與蘇聯在古巴導彈上的博弈結果。對於蘇聯來說,退下來的結果是丟了面子,但總比戰爭要好;對美國而言,既保全了面子,又沒有發生戰爭。這就是這兩隻「大公雞」博弈的結果。啟示:任何事情都看似很難,實質不難;任何事情都比你預期的更令人滿意;任何事情都能辦好,而且是在最佳的時刻辦好——麥可斯韋爾定律有助你走出陰霾。左邊還是右邊前面我們已知,在博弈中納什均衡點如果有兩個或兩個以上,結果就難以預料。這對每個博弈方都是麻煩事,因為後果難料,行動也往往進退兩難。一個小例子就是兩個騎自行車的人對面碰頭,很容易互相「向住」:因為不知道對方會不會躲、往哪邊躲,自己也不知該如何反應,於是撞到一起。自行車相撞一般不會造成什麼大麻煩,可是如果換成馬車、汽車,就可能出現傷亡。所以,應該有一個強制性的規定,來告訴人們該怎麼做。開車的時候你應該走哪一邊?假如別人都靠右行駛,你也會留在右邊。套用「假如我認為他認為」的框架進行分析,假如每個人都認為其他人認為每個人都會靠右行駛,那麼每個人都會靠右行駛,而他們的預計也全都確切無誤。靠右行駛將成為一個均衡。不過,靠左行駛也是一個均衡,正如在英國、澳大利亞和日本出現的情況。這個博弈有兩個均衡。均衡的概念沒有告訴我們哪一個更好或者哪一個應該更好。假如一個博弈具有多個均衡,所有參與者必須就應選擇哪一個達成共識,否則就會導致困惑。海上航行也要面臨同樣的問題,儘管大海遼闊,但是航線卻是比較固定的,因此船隻交會的機會很多,這些船隻屬於不同的國家,如何調節誰進誰退的問題呢?先來看一個小笑話:一艘軍艦在夜航中,艦長發現前方航線上出現了燈光。艦長馬上呼叫:「對面船隻,右轉30度。」對方回答:「請對面船隻左轉30度。」「我是美國海軍上校,右轉30度。」「我是加拿大海軍二等兵,請左轉30度。」艦長生氣了:「聽著,我是『列剋星頓』號戰列艦艦長,這是美國海軍最強大的武裝力量,右轉30度!」「我是燈塔管理員,請左轉30度。」即使你官階、艦船再大,燈塔也不會給你讓路。那麼,如果是兩條船相遇,又如何決定呢?誰先讓不能等待臨時談判,也不是由官階說了算。海上避碰也有像許多國家規定車輛在馬路上靠右走那樣不容談判的規矩。人們規定,迎面交會的船舶,各向右偏一點兒,問題就解決了。十字交叉交會的船舶,則規定看見對方左舷的那艘船要讓,慢下來或者偏右一點兒都可以。這就從制度上規定了避讓的方式。這十字交叉交會時如何避免碰撞的規矩,就是上述博弈的兩個納什均衡中的一個。究竟哪一個納什均衡真正發生,現在就看兩船航行的相互位置。如果甲看見乙的左舷,甲要讓乙原速直走,就是右上角那個納什均衡;如果乙看見甲的左舷,乙要讓甲原速直走。誰打電話上面的例子是通過規定解決了問題,不過,若是遇到電話打到一半突然斷了的事,你該怎麼辦?假如你正在和女友通話,電話斷了,而話還沒說完。這時有兩個選擇,馬上打給對方,或等待對方打來。注意:如果你打過去,她就應該等在電話旁,好把自家電話的線路空出來,如果她也在打給你,你們只能聽到忙音;另一方面,假如你等待對方打電話,而她也在等待,那麼你們的聊天就沒有機會繼續下去。一方的最佳策略取決於另一方會採取什麼行動。這裡又有兩個均衡:一個是你打電話而她等在一邊,另一個則是恰好相反。一個解決方案是,原來打電話的一方再次負責打電話,而原來接電話的一方則繼續等待電話鈴響。這麼做的好處是原來打電話的一方知道另一方的電話號碼,反過來卻未必是這樣。另一種可能性是,假如一方可以免費打電話,而另一方不可以(比如你是在辦公室而她用的是住宅電話),那麼,解決方案是擁有免費電話的一方應該負責第二次打電話。還有一種比較通常的解決方法是,由較熱切的一方來打電話,如一個煲電話粥成癮的家庭主婦對談話的熱情很高,而她的同伴就未必這樣,這種情況下通常是她打過去。再如戀愛中的男女遇到這種情況,通常也是由主動追求者打電話。假如不考慮以上因素,那麼打這個電話又得用到這種「混合策略」了:設想雙方都投硬幣決定自己是不是應該給對方打電話,根據前面給出的條件,兩人這種隨機行動的組合成為第三個均衡。假如我打算給你打電話,我有一半機會可以打通(因為這時你恰巧在等我打電話),還有一半機會發現電話佔線;假如我等你打電話,那麼,我同樣會有一半機會接到你的電話,因為你有一半機會主動給我打電話。每一個回合雙方完全不知道對方將會採取什麼行動,他們的做法實際上對彼此都最理想。因為我們只有一半機會重新開始被打斷的電話聊天,我們知道我們(平均來說)要嘗試兩次才能成功接通。需要再次強調的是:均衡不一定是博弈的最優結果。在「囚徒困境」中,惟一的均衡是一起招認,站在群體的角度,這是最壞的結果。均衡只是博弈的最「穩定」結果,或者說是最可能出現的結果。那麼,這就需要我們思考一個問題:如果這個「穩定」結果效果不佳,我們能否找到合理的策略打破這個「均衡」?啟示:在同時行動的博弈中,有三個行動法則:一是尋找和運用優勢策略;二是尋找和避免劣勢策略,同時假定你的對手也在這麼做;三是尋找和運用均衡。第3章 打破「囚徒困境」在「囚徒困境」中表現最好的策略直接取決於對方採用的策略,特別是取決於這個策略為發展雙方合作留出多大的餘地。這個原則的基礎是下一步相對於當前一步的權重足夠大,即未來是重要的。囚犯的救贖為了驗證面對「囚徒困境」時人們可選擇的策略以及這些策略的有效程度,美國的學者組織了一次以此為主題的計算機競賽。競賽要求參加者根據這一困境設計程序,並將程序輸入計算機,通過各種程序的相互對局的最後得分評判優劣。競賽的遊戲方法是:遊戲雙方都在不知對方將如何選擇的情況下,選擇合作或背叛。這些選擇放在一起就產生了四個可能的結果,即:合作,合作;合作,背叛;背叛,合作;背叛,背叛。在這個遊戲中,如果雙方選擇合作,雙方都能得到較好的結果R,即「對雙方合作的獎勵」。在這個例子中R為3分,3也可以代表參賽者得到的獎金數。如果一方合作而另一方背叛,那麼,背叛者得到「對背叛的誘惑」T=5。而合作者則得到「給笨蛋的報酬」S=0。如果雙方都背叛那麼雙方都得到P=1,即「對雙方背叛的懲罰」。參賽者提出了各種程序,但是大致可分為「善良的」、「邪惡的」和「隨意的」三類,競賽的結果也許有些出人意料:「善良」即「以合作為主」的策略大獲全勝,而「邪惡」即「以佔便宜為主」的策略成績不佳。現在考慮一個雙方對局的例子。一個對策者採用的策略是每一步都背叛,即「總是背叛」,另一個對策者採用的策略是「一報還一報」,即在第一步合作,然後就採用對方上一步的選擇。「一報還一報」意味著在對方每一次背叛之後就背叛一次。當對方採用「一報還一報」時,採用「總是背叛」的對策者,將在第一局得到收益,在而後的對局中都得到相應的回擊。這樣,這個背叛者只是在第一局得到5分,而在以後的每局都只能得到1分,最終他可能會「戰勝」對手,但由於總分仍然很低,而被淘汰出局。你可能忍不住要問:「什麼是最好的策略?」換句話說,什麼策略能使對策者得到可能的最高分?這個問題問得很好。但是就像以後要說明的一樣,獨立於對方所用策略之外的最好決策規則是不存在的。從這個意義上說,「囚徒困境」完全不同於一般遊戲,如國際象棋。一個象棋大師可以有把握地假定對手將走讓他最頭疼的一步,這種假定是這類遊戲的基礎。然而在這裡,遊戲者的利益並不是完全衝突的。雙方可以通過合作而得到「對合作的獎勵」R,也可以通過背叛而得到「對背叛的懲罰」P。如果你假定對方總是走你最擔憂的一步,那麼,你就會認為其他人總是不合作,這就會使你也不合作,最後招來無休止的懲罰。所以與下棋不同,在「囚徒困境」中假定對方一心要贏你是不可靠的。事實上,在「囚徒困境」中表現最好的策略直接取決於對方採用的策略,特別是取決於這個策略為發展雙方合作留出多大的餘地。這個原則的基礎是下一步相對於當前一步的權重足夠大,即未來是重要的。總的來說,如果你認為今後將難以與對方相遇,如果你不太關心自己未來的利益,那麼,你現在最好是背叛,而不用擔心未來的後果。這樣,我們得到了第一個正式的結論,但卻是一個令人傷心的結論,即:如果未來是重要的,就不存在最優策略。啟示:好萊塢大片《肖申克的救贖》是一部很好看的電影,主要內容是一個被冤屈的囚犯如何憑著堅定的信念和聰明才智逃出牢房。我們的「囚犯」也可以通過好的策略合作,擺脫「困境」的詛咒。「一報還一報」的偉大勝利區分善良規則好壞的一個特徵是,看它們如何迅速地和可靠地對來自對方的挑戰作出反應。一個規則可以被稱為「報復性的」,如果它在對方的背叛之後立即以背叛報復。除非一個策略能迅速反應來自對方的挑戰,否則,對方將簡單地從這樣一個好說話的策略身上獲得越來越多的好處。在比賽中,有好幾個規則故意使用若干次背叛,試試看它們能否討到便宜。因此,很大程度上決定善良規則的最後名次的是它們能否很好地應付這些挑戰。對付這類挑戰性規則的最好辦法是時刻準備報復來自對方「無緣無故」的背叛。因此,善良能得到好處,報復也能得到好處。「一報還一報」綜合了這些優點,它是善良的、寬容的和具報復性的。它從不首先背叛,但是不管過去相處的關係如何好,它總能被一個背叛所激怒,而迅速作出反應。生態分析的結果說明了「一報還一報」的又一個勝利。在最初的競賽中「一報還一報」領先一點點,而且在整個生態模擬過程中一直保持領先。到了第1000代,它是最成功的規則,並且比任何一個其他規則都增長得快。「一報還一報」的所有記錄是令人難忘的。概括地說,「一報還一報」是62個參賽者中平均得分最高的規則。在競賽的生態模擬中它一直保持領先。加上它在實驗室的對策實驗中的良好表現,「一報還一報」顯然是一個非常成功的策略。「一報還一報」的成功可以說明的是它是一個很具適應性的規則:即它在很大範圍的環境中表現極佳。它的成功部分是由於其他規則預料到它的存在並且被設計得與它很好相處。要和「一報還一報」很好相處就要和它合作,這反過來就幫助了「一報還一報」。即使那些被設計成伺機佔便宜而不被懲罰的規則,也很快向「一報還一報」道歉。任何想占「一報還一報」便宜的規則最終將傷害自己。「一報還一報」從自己的不可欺負性得到好處,是因為以下三個條件得到了滿足:1.遇到「一報還一報」的可能性是顯著的;2.一旦相遇,「一報還一報」很容易被識別出來;3.一旦被識別出來,其不可欺負性就顯示出來。因此,「一報還一報」從它自己的清晰性中得到好處。另一方面,「一報還一報」放棄了占他人便宜的可能性。這種機會有時是很有利可圖的,但是試圖佔便宜而引來的問題也多種多樣。首先,如果一個規則用背叛試探是否可以佔便宜,它就得冒被那些可激怒的規則報復的風險。第二,雙方的反擊一旦開始,就很難自己解脫。「一報還一報」的穩定成功的原因是它綜合了善良性、報復性、寬容性和清晰性。它的善良性防止它陷入不必要的麻煩,它的報復性使對方試著背叛一次後就不敢再背叛,它的寬容性有助於重新恢複合作。它的清晰性使它容易被對方理解,從而引出長期的合作。啟示:一報還一報能夠贏得競賽不是靠打擊對方,而是靠從對方引出使雙方都有好處的行為。你不必每次都贏雖然預見對於合作的進化不是必要的,但它卻對我們很有幫助。因此在這裡將分別對參與者和改革者提供建議。下面為那些處於「囚徒困境」的人提供建議。從個體的眼光看,目標是在與對手的一系列對局中儘可能地得高分。由於這個遊戲是「囚徒困境」,參與者會受到背叛的短期誘惑,但是通過與對方建立雙方合作的模式可以得到更多的長期好處。對計算機競賽的分析和理論研究的結果,為我們提供了一些有用的信息,即在不同的條件下什麼樣的策略會起作用和為什麼這些策略能表現得好。這一章就是把這些發現轉化成對參與者的建議。在持續的「重複囚徒困境」中應如何表現,下面是四個簡單的建議:1.不要嫉妒人們習慣於考慮零和對局,在這種情況下,一個人贏,另一個就輸。一個很好的例子就是下棋比賽。為了能贏,一個參賽者必須在大部分時間裡比對手做得更好。白棋贏黑棋就輸。然而生活中的大多數情況都是非零和的。雙方可以都做得很好,也可以都做得很差。雙方的合作是可能的,但並不是總能實現。這就是為什麼「囚徒困境」是各種各樣的日常情形的有用模型。人們傾向於採用相對的標準,這個標準經常把對方的成功與自己的成功對立起來。這種標準導致了嫉妒,嫉妒導致企圖抵消對方已經得到的優勢。在「囚徒困境」的形式下,抵消對方優勢只能通過背叛來實現。但是背叛導致更多的背叛和對雙方的懲罰。因此嫉妒是自我毀滅。要求自己比對方做得好不是一個很好的標準,除非你的目的是消滅對方。在大多數情況下,這個目的是不可能實現的。「一報還一報」由於與其他多種多樣策略相處得很好而贏得了競賽。平均來說,它比競賽中的其他任何策略都做得更好。但是「一報還一報」從來沒有一次在遊戲中比對方得更多的分!事實上,它不可能比對方多得分。它總是讓對方先背叛,並且它的背叛次數決不比對方背叛的多。因此「一報還一報」不是得到和對方一樣多的分,就是比對方略少。「一報還一報」贏得競賽不是靠打擊對方,而是靠從對方引出使雙方有好處的行為。「一報還一報」如此堅持引出雙方有利的結果,從而使它獲得比其他任何策略更高的總分。因此在一個非零和的世界裡,你沒有必要非得比對方做得更好。特別當你要和許多不同的對手打交道時更是這樣。只要你自己能做得好就沒有理由去嫉妒對方的成功。因為在長時間的「重複囚徒困境」中,其他人的成功是你自己成功的前提。在生意場中也是這樣,一個從供應商那兒買來東西的公司期望供方和買方都有好處的成功的關係。妒忌供方的利潤是完全沒有意義的。任何通過不合作行為(如不按時付賬)來減少這種利潤的企圖,都將激起供方的報復行動,報復行為可以採用多種形式,經常以不明顯懲罰形式,諸如拖延發貨,較低的質量保證,不願意打折扣,或者不交換市場條件變化的信息。這種報復使得嫉妒代價很大。買者不要擔心賣方的相對的利潤,而可以考慮是否有其他更好的購買策略。2.不要首先背叛競賽和理論分析的結果都表明,只要對方合作你也合作就會有好處。競賽結果是很令人吃驚的。決定一個規則表現如何的惟一最好的特徵是這個規則是否善良。也就是說這個規則是否不首先背叛。在第一輪競賽中,前8名規則中都是善良的,在後7名規則中沒有一個是善良的。在第二輪競賽中,前15名規則中只有一個是非善良的(它名列第8),而後15名規則中只有一個是善良的。有些不善良的規則,使用相當複雜的方法來試探它是否能逃脫懲罰。例如嘗試在第一步背叛,如果對方報復的話,它就馬上撤回。在另一個例子中,它在背叛前等待十幾步,看看對方是否能被哄騙和被偶爾佔便宜。如果是的話,就更頻繁地增加背叛,直到對方反擊而被迫撤回。但是這些嘗試道德背叛的策略都表現得不怎麼好。因為存在許多由於願意報復而不被佔便宜的策略,所以導致衝突的代價有時是很高的。甚至許多專家也沒有意識到善良性對避免不必要的衝突的價值。在第一輪競賽中,由對策論專家送來的規則中幾乎有一半是不善良的。參考了第一輪的明顯結果,第二輪比賽中大約有1/3規則用不善良的策略,但是,它們都沒有佔到便宜。前面的競賽結果提供了另一個方式來說明為什麼善良的規則能表現得如此好,由於善良的規則相互之間相處得很好,因而善良規則的群體是很難被侵入的。而且能夠阻止單個變異個體侵入的善良規則的群體也能阻止這個變異規則的任何小群體的侵入。當然,你可以嘗試更保險的方式,即先背叛直到對方合作,才開始合作。然而,競賽的結果表明,這實際上是一個很有風險的策略,因為你的最初的背叛就可能引起對方的報復,並使你處於要麼被佔便宜要麼雙方背叛的兩難境地。如果你懲罰對方的報復,這種反應就會一直延續下去。如果你寬恕了對方,你就得冒被欺負的風險。即使你能避免這些長遠問題,對你的最初背叛的當下報復會使你希望自己從一開始就應該是善良的。對競賽的生態分析揭示了另一個為什麼首先背叛是很冒險的道理。第二輪競賽中前15名規則中惟一的非善良策略是名列第8的「哈林頓」。因為它與競賽中的名次較低的規則相遇的得分都很高。在假想的未來生態競賽中,名次較低的規則在群體中的比例越來越小,最終能被這個最初挺成功的非善良策略佔便宜的策略就越來越少,接著它自己也消亡了。因此,只會佔「傻瓜」的便宜是沒有用的,它只不過是一個自我毀滅的過程。這個教訓說明,雖然不善良在最初看來似乎是很有希望的,但長期下去它將毀壞使自己成功所必需的環境。3.對合作與背叛都要給以回報「一報還一報」超常的成功給出了一個簡單的但又是很有力量的建議:要回報。在第一步合作之後,「一報還一報」只是簡單地回報對方在上一步的所為。這個簡單的規則驚人地有效。它贏得了第一輪「囚徒困境」計算機競賽,並取得比任何其他由對策論專家們送來的規則更高的平均得分。每一個第二輪競賽的參加者知道這個結果,但「一報還一報」又贏了第二輪競賽。這個勝利顯然是令人驚訝的。因為每一個參賽者都是在考慮了「一報還一報」在第一輪競賽中的勝利結果之後,才提交參賽規則的。顯然人們都希望能幹得更好,但是他們錯了。「一報還一報」不僅贏得競賽本身,而且在假設的繼續比賽中比其他任何規則表現得都好。這表明「一報還一報」不僅與最初的各種規則相處得很好,而且能與那些可能在未來群體中占較大份額的成功的規則相處得很好,它不毀壞自己成功的基礎,相反它在與其他成功的規則相互交往中繁榮起來。「一報還一報」所體現的回報在理論上也是很重要的。當未來相對於現在是足夠重要的時候,「一報還一報」是穩定的。這就意味著,如果每個人都使用「一報還一報」策略,那麼對一個特定的個體的最好建議就是也採用「一報還一報」策略。或者這麼說,如果你能肯定對方是採用「一報還一報」,並且這種交道將持續足夠長,那麼,你最好也採用相同的策略。事實上,「一報還一報」很善於區分哪些規則會回報它的最初合作,哪些不會。這就使得它能夠以小群體形式侵入「小人」的世界。並且,它回報背叛也回報合作。這使得它是可激怒的。而善良的策略要阻止被侵入,就必須是可激怒的。在反應對方的背叛時,「一報還一報」保持了懲罰和寬恕的平衡。「一報還一報」總是在對方每次背叛之後只背叛一次。那麼,是否總是嚴格的一對一回報才是最有效的平衡?這就很難說了,但有一點是清楚的,即用多於一次背叛來回報對方的背叛將有可能使衝突升級。另一方面,少於一對一的回報將有被佔便宜的危險。以上分析的啟示是,最優的寬恕水平與環境有關。特別是如果主要的危險是來自那些善於占「好說話」的規則的便宜的策略,那麼,太多的寬恕就要付出代價。對一個給定的環境,準確的平衡是很難確定的,但是,競賽的結果證明對背叛類似一對一的反應可能在大多數情況下都是相當有效的。因此,對參與者的一個很好的建議是對合作和背叛都要給予回報。4.不要耍小聰明競賽結果表明在「囚徒困境」的情況下人們容易耍小聰明,然而複雜的規則並不比簡單的規則做得更好。事實上,這些規則的共同問題是,使用一些複雜的方法來推斷對方。而這些推斷常常是錯誤的。一部分問題是對方經常用試探性的背叛來表明它不會被引誘而合作,但是問題的關鍵是這些規則沒有考慮到它自己的行為會引起對方的變化。對方對你的行為是有反應的,對方將把你的行為看作你是否回報合作的信號。因此,你自己的行為將會反射到你的身上。試圖使得分最大化的規則把對方看作環境的一個不變的部分而忽略了相互的作用,不管他們在有限的假設下所做的計算是多麼的聰明。如果你離開雙方相互適應的簡單原則,那麼你的聰明是不會有好結果的。這是一條艱難的路,顯然在兩次競賽中沒有一個複雜的規則精於此道。另一個過分聰明的方式是使用「永久報復」的策略。這個策略只要對方合作它就合作,但是一旦對方背叛一次,它就決不合作。由於這個策略是善良的,它與其他善良的策略相處得很好。並且它與那些完全隨機的規則相遇時幹得也不錯。但它與許多其他規則相遇就幹得很差,因為對於那些偶爾背叛但準備一旦受懲罰就撤回的規則來說,它太快放棄合作了。「永久報復」看起來似乎很聰明,因為它為避免背叛提供了最大的激勵,但是它為了自己的利益顯得太嚴厲了。參加競賽的規則中還有第三種太聰明的形式是,它們採用的策略是如此複雜,以至於其他策略不能把它們與純粹的隨機選擇區分開來。用另一方式來說,就是太多的複雜性就顯得是完全雜亂無章。如果你採用一個看起來是隨機的策略,那麼你也就顯得對對方不反應,如果你是不反應的,對方就受不到與你合作的激勵。因此複雜到不可理解是非常危險的。當然,在許多人類事務中,一個使用複雜規則的人可以向對方解釋每一個選擇的理由。然而,問題出現了:對方可能懷疑所提供的這些理由,在這個情況下對方將認為不值得有任何反應,對方會把一個顯得不可預測的規則看作不可改造的,結果自然是導致背叛。「一報還一報」在競賽中得到巨大成功的原因之一是它具有很大的清晰性,即它非常容易被對方理解。當你使用「一報還一報」策略時,對方有很好的機會去理解你在幹什麼。你對任何背叛的一對一的反應是一個很容易被意識到的模式。而且你的未來行為是能被預測的。一旦這些情況發生了,對方能容易地發現應付「一報還一報」的最好方式就是與他合作。假設這個遊戲有足夠的可能繼續下去,至少還有下一步相遇。那麼當你遇到「一報還一報」策略時只有馬上和他合作是最好的,這樣你將可以在下一步得到合作。另外,在零和對策(如下棋)和非零和對策(如「重複囚徒困境」)之間有一個重要的不同。在下棋時,讓你的對手猜疑你的企圖是很有用的,你的對手越是懷疑,他(或她)的策略就越沒效果。但是在非零和情況下,如此聰明不總是有好處的。在「重複囚徒困境」中,你要從對方的合作中得到好處。訣竅在於鼓勵合作,一個好的方式就是清楚地表明你願意回報,這就是「一報還一報」之所以如此有效的原因。啟示1:重複囚徒困境的幾個建議:(1)不要嫉妒;(2)不要首先背叛;(3)對合作與背叛都要給以回報;(4)不要耍小聰明。啟示2:聯翩而來的好運總是可疑的,只會佔「傻瓜」的便宜是沒有用的。啟示3:一報還一報從來沒有一次在遊戲中比對方得到更多的分!未來影響現在對未來的預期,是影響我們行為的重要因素。一種是預期收益:我這樣做,將來有什麼好處;一種是預期風險:這樣做可能面臨的問題。這些將影響個人的策略,如學生讀書,為了將來考上好學校取得文憑,獲得更高的地位和收入。如果文憑一錢不值,就會影響學生的熱情。也影響與他人、社會的關係。地攤、車站、旅遊點,這些人群流動性大的地方,不但商品和服務質量最差,而且假貨橫行,因為在商家和顧客之間「沒有明天」——一個旅客不大可能因為你的飯菜可口而再次光臨,一鎚子買賣,不賺白不賺。在公共汽車上,兩個陌生人會為一個坐位爭吵,可如果他們認識,就會相互謙讓。在相互社會聯繫緊密的人際關係中,人們普遍比較注意禮節、道德,因為都需要這個環境。道德、法律、權力利益的劃分,都與「還要見面」有關。從消極的層面看,我們互不侵犯,是為了避免沒完沒了、兩敗俱傷的循環報應。例子:兩個原始人見面,一個拿著獸皮,一個拿著野果,他們都想把對方的東西據為己有。如果他們的見面是偶然的,可能相互搶劫;可是如果他們都生活在附近,考慮到對方家族的報復,搶劫的風險就大了。所以他們不去打對方的主意——所有權就這樣產生了。如果他們確實想得到對方的東西,他們可以選擇合作——以物易物,交易就這樣產生了。兩個相鄰的國家,如果相互敵對,是一件非常不幸的事。它們不可能「搬家」,又不可能消滅對方(這是現代國際關係準則所不允許的),這個死結就可能纏繞它們許多年。遺憾的是,這樣關係的鄰國還不少,如巴以、印巴、兩伊以及伊拉克和科威特。希臘和土耳其也曾經是這樣的世仇,現在關係雖已緩和,但是它們之間的不信任感還是長久不能消除。長期敵對對雙方來說,都是損失巨大的。不但隨時有爆發戰爭的危險,經濟建設也受到拖累。誰也不可能把錢花在朝不保夕的危險地區,一來風險太大,二來,如果在邊界有許多建設,也更容易被對方訛詐——那無異於是把人質交給對方。一個例子就是韓朝關係,韓國比朝鮮更害怕發生戰爭,因為首都漢城就在對方的炮火射程之內。一個包袱更重的國家,維護和平的代價要比對方更大。中蘇交惡的年代,雙方都在邊境地區陳兵百萬,巨大的軍費開支和潛在的戰爭風險對兩國都是重負。現在兩國關係改善,互信增加,邊境軍事力量大大減弱,可以說是一個雙贏。從這個意義上說,「面向未來」不僅僅是一句外交辭令。「籠中豬」博弈簡單的例子如果能夠說明方法,能夠啟迪思維,就有它的價值。今天再講博弈論著作中常見的另一個簡單的例子「籠中豬」博弈。籠子裡面有兩隻豬,一隻比較大,一隻比較小。籠子很長,一頭有一個按鈕,另一頭是飼料的出口和食槽。按一下按鈕,將有相當於10份的豬食進槽,但是按按鈕以後跑到食槽所需要付出的「勞動」,加起來要消耗相當於2份的豬食。問題是按鈕和食槽分置籠子的兩端,按按鈕的豬付出勞動跑到食槽的時候,坐享其成的另一頭豬早已吃了不少。如果大豬先到,大豬呼啦啦吃到9份,小豬只能吃到1份;如果同時到達,大豬吃到7份,小豬吃到3份;如果小豬先到,小豬可以吃到4份,而大豬吃到6份。「籠中豬」博弈的具體情況如下:如果兩隻豬同時按鈕,同時跑向食槽,大豬吃進7份,得益5份,小豬吃進3份,實得1份;如果大豬按按鈕後跑向食槽,這時小豬搶先,吃進4份,實得4份,大豬吃進6份,付出2份,得益4份;如果大豬等待,小豬按按鈕,大豬先吃,吃進9份,得益9份,小豬吃進1份,但是付出了2份,實得-1份;如果雙方都懶得動,所得都是0。比較以上數字,我們知道「等待」是小豬的優勢策略,「按按鈕」是小豬的劣勢策略。先把小豬的劣勢策略消去。現在來看大豬。由於小豬有「等待」這個優勢策略,大豬只剩下了兩個選擇:等待一份不得;按按鈕得到4份。所以「等待」就變成了大豬的劣勢策略(注意,是現在才變成劣勢策略)。把它也刪去,就得到「籠中豬」博弈的結局:小豬只是坐享其成地等待,每次都是大豬去按按鈕,小豬先吃,大豬再趕來吃。「籠中豬」博弈有許多應用,它可以解釋為什麼佔有更多資源者必須承擔更多的義務。啟示:這個例子描述了走出囚徒困境的另一個途徑:找出一個大慈善家,讓它遵守合作協議,並容忍其他人作弊。同樣的事情見之於許多聯盟。在許多國家,一個大政黨和一個或多個小政黨必須組成一個聯合政府。大政黨一般願意扮演負責合作的一方,委曲求全,確保聯盟不會瓦解,而小政黨則堅持它們自己的特殊要求,而選擇通常可能偏向極端的道路。又如在北約內部,美國承擔了防務開支很大比例的份額,大大便宜了西歐和日本。美國經濟學家曼庫爾·奧爾森將這一現象非常簡潔地稱為「小國對大國的剝削」。增大未來的影響通常人們認為合作是件好事,畢竟雙方合作在「囚徒困境」中對雙方都有好處。然而如前面說過的,在一些情形中人們要做的卻恰恰相反。只要這種接觸不是重複的,合作就非常困難,正是持續的接觸,使基於回報的合作的穩定成為可能。促進雙方合作可以從三個方面著手:使得未來相對於現在更重要些;改變對策者的四個可能的結果的收益值;教給對策者那些促進合作的準則、事實和技能。如果未來相對於現在是足夠重要的話,雙方的合作是穩定的。因為每個對策者可以用隱含的報復來威脅對方,如果相互之間的接觸能持續足夠長使得這種威脅能夠奏效的話。這個結論強調了促進合作的第一方法的重要性,即增大未來的影響。有兩個基本的方法來做到這一點:使相互作用更持久和使相互作用更頻繁。最直接促進合作的方法是使相互作用更持久。例如,婚禮就是一個用來慶祝和促進持續關係的公共行為。相互作用的持久性不僅對相愛的人有用,對敵人也有用。能證明這一點的最令人吃驚的例子就是在第一次世界大戰的塹壕戰期間發展起來的「你不打我,我也不打你」的系統。塹壕戰與眾不同的是敵對雙方的部隊要相互接觸很長的時間。在更機動的戰爭中,一支部隊在每次戰鬥中可能遭遇不同的敵人。因此,你希望對方的個體或小單位將會在以後回報你,而合作是沒有好處的。但是在相對固定的戰鬥中,兩支部隊之間的接觸要持續一個相當長的時間。這種持續的接觸,使得基於回報的合作是值得一試的,並且使合作得以建立。另一個增大未來影響的方法是使接觸更加頻繁。在下一步接觸很快就會發生的情況下,下一步顯然比通常更重要。在商業上,專業化公司趨向於限制在與少數幾個公司接觸以便使這種接觸更加頻繁。這是為什麼合作在小城鎮比在大城市容易出現的一個原因。在某些行業中往往存在著限制競爭的默契,這也是為什麼同類行業的公司都試圖排斥那些可能擾亂這種默契的新公司。因此,原則總是一樣的,經常接觸有助於促進穩定的合作。集中接觸是使兩個人更經常見面的一個方法。在協商談判中,另一個使接觸更加頻繁的方法是把問題分解成若干的部分。例如,可以將軍備控制和裁軍條約分解成許多階段,這樣就允許雙方有更多讓步的機遇而不只是一兩個讓步。這樣可以使回報更有效。如果雙方都知道對方的一步不合適的策略可以通過下一步的回報來補償,那麼雙方對整個過程可以按所期望的進行就更有信心。而且,如果雙方對自己識別欺騙的能力缺乏信心,那麼,有許多小的步驟比只有少數大的步驟更有助於促進合作。分解是一個廣泛使用的原則。在商業上,商人們喜歡一個大訂單分別按每次發貨時間付款,而不願等到最後付總賬。使得當前步驟的背叛相對於整個未來的接觸過程來說不是那麼有誘惑力,這是促進合作的好方法。啟示:兩隻睏倦的刺蝟由於寒冷而擁在一起。可因為各自身上都長著刺,於是它們離開了一段距離,但又冷得受不了,於是湊到一起。幾經折騰,兩隻刺蝟終於找到一個合適的距離:既能互相獲得對方的溫暖而又不至於被扎。了解並關心對方,並巧妙地保護自己,會使合作更加長久。為什麼出租比出售好1987年,紐約市長埃德·科克成功地增加了曼哈頓的持照計程車的數目。此前50年,曼哈頓人口增加了300萬,但計程車只多了100輛。計程車短缺的一個跡象是,當時,合法經營一輛計程車的權利(俗稱「大獎章」)在市場公開標價125000美元。與此同時,計程車按每天兩班、每班12小時出租,每班價格約為60美元(每年約45000美元)。假如市政府拍賣100個新的大獎章,就能輕鬆地賺到1250萬美元。問題是,所有的獲得者就會擔心,市政府已經發現了一個好得難以置信的發財機會。既然如此,為什麼明年不再拍賣100個新的大獎章呢?如果市政府不能承諾限制大獎章的頒發數量,以保證大獎章不會變得一文不值,那麼第一個後果就是再也不會有人願意為大獎章出高價了。現在科克市長請你做顧問。他想知道怎樣才能同時增加計程車的數目和庫房收入。他正在尋找辦法,使自己作出一個承諾,並以此約束自己(以及以後的政府)不要再源源不斷地印製新的許可證,防止舊的大獎章大大貶值。當時,計程車與轎車委員會正左右為難,但誰也不會單單聽信一個政客的話。你有什麼建議?訣竅在於出租而非出售大獎章。這麼一來,沒人要為以後的價值付錢。市長就會有一種限制大獎章出租數量的激勵,因為假如他出租太多,總租金就會下降,並且很有可能隨著大獎章變得一文不值而一直降到零。注意,這實際上就是一步一步作出承諾的應用實例。這裡的步驟不是大獎章的數目,而是大獎章的有效期。人們願意在一周或一年之內相信這個市長,而新規定的通過是需要一段時間的。最具風險的是大獎章一年的價值。對市長而言與其將今年的大獎章、明年的大獎章以及未來的大獎章合併為一枚永久性的大獎章,然後再出售,還不如一次只出售一枚大獎章,從而恢復自己的可信度。要做到這一點,一個簡單的方法就是出租,而不是出售。改變收益值那些碰到「囚徒困境」的人有一個共同的反應,即「應該有一個法律來防止這類事情的發生」。事實上,擺脫「囚徒困境」是政府的一個主要的功能:保證人們無論如何也得做那些對社會有用的事。法律使人們交稅,不偷盜,忠實履行與陌生人的合同。這每一件事都可以看作是有許多人參加的大「囚徒困境」。沒有人願意納稅,因為它的好處很難看到而代價是直接的。但是如果每一個人都納稅,大家就能生活得更好,即分享學校、道路和其他公共設施的好處。這就是盧梭所說的政府的作用就是保證每一個公民「被強迫得到自由」。政府所做的正是改變有效的收益值。如果你逃避交稅,你就可能被送進監獄。這種前景使得背叛的選擇不那麼吸引人了。即使半官方也能通過改變對策者的收益值而實施他們的規矩。例如,在「囚徒困境」的原始故事中,兩個同案犯被逮捕並被分別審訊。如果他們同屬一個幫派組織,那麼他們知道告密是要受到懲罰的。這將降低背叛同夥的收益值,使得他們都不坦白並由於他們雙方保持沉默的合作而得到較輕的徒刑。在收益結構上的大變化能夠改變相互作用使得情況不再是一個「囚徒困境」。如果對背叛的懲罰是如此之大以至於不管對方如何選擇,從短期來說合作都是最好的選擇的話,那麼就不再有困境。可是,收益值的改變沒有必要如此激烈才能奏效,即使相當小的一點改變就可以有助於回報的合作的穩定,儘管這相互作用的情況仍然是「囚徒困境」。所以,通過改變收益值來促進合作沒有必要去消除背叛的短期激勵與合作的長期激勵之間的緊張關係,而只要使對雙方合作的長期激勵大於對背叛的短期激勵就行。教育人們相互關心在社會中,一個有效促進「雙贏」的方法是教育人們關心他人的利益。家長和學校花了很大的努力去教育年輕人關心其他人的幸福。用對策論的術語來說,這意味著這些長輩試圖使孩子們形成這樣的價值觀念,即這些新一代的公民的偏好中,不僅有他們自己個人的利益,還至少在某種程度上結合了他人的利益。毫無疑問,在這樣一個關心他人的社會裡,即使遇到「囚徒困境」,成員之間也容易達成合作。利他主義就是描述這樣一個現象,一個人的利益效用是與另一個人的福利相聯繫的。因此利他主義是一個人行為的動機。但是必須認識到,有一些看起來是寬宏大量的行為可能有其他各種原因而不是利他主義。例如,慈善行為往往不是出於對不幸者的關心而是為了它所能帶來的社會讚賞。在傳統和現代社會中贈送禮物可能是交換過程的一部分。它的動機更多的是使受惠者承擔某種義務而不在於改善受惠者的福利。從生物進化的遺傳學觀點來看,利他主義能在親屬之間維持。冒著生命危險去搶救下一代的母親能夠增加她的基因拷貝的生存機會。這是遺傳親緣理論的基礎。人們之間的利他主義也可以通過社會化來維持。但是,這裡有一個嚴重的問題。一個自私者可以從其他人的利他行為中得到好處而不給以任何回報。我們都遇見過一些令人討厭的人,他期望其他人寬宏大量,只考慮自己的需要而不考慮別人的利益。必須把這種人與關心他人的人區別對待,免得被他佔便宜。這個道理告訴我們,利他主義的代價可以通過首先對每一個人採用利他行為,然後只對那些有相同的感情的人採取利他行為來控制。但是這很快就使你回到作為合作基礎的回報上來。教育人們要回報「一報還一報」可能是個反擊自私者占我們便宜的有效的策略。但是,它是一個人或國家要遵循的道德策略嗎?當然,答案取決於什麼是一個人的道德標準。也許最廣泛接受的道德標準是這一金科玉律:己所不欲,勿施於人。在「囚徒困境」的情況下,這一金科玉律似乎意味著你應該總是合作,因為合作是你希望從對方得到的。這個觀點的問題在於:人家打你一巴掌,你還把另一邊臉轉過去,等於鼓勵對方再占你便宜。無條件的合作不僅傷害你自己,而且傷害了這個成功的剝削者接著要遇到的無辜者。無條件合作將會寵壞對方,並為社會留下了改造被寵壞者的負擔。這說明回報是比無條件合作更好的道德基礎。然而,基於回報的策略似乎沒有達到道德的高度,至少按照我們的日常的直覺是沒有。回報當然不是道德的一個好的基礎,但它不只是自私自利者的道德。它確實不僅幫助自己,而且幫助了別人。它是通過使剝削性策略難以生存來幫助別人。一個基於回報的策略能讓對方從雙方合作中得到獎勵,這也是當雙方最好時它自己所能得到的同樣報酬。堅持公平是許多基於回報的規則的基本特徵,這從「一報還一報」在「囚徒困境」競賽中的表現可以清楚地看到。「一報還一報」贏得兩輪的競賽,但是在任何一局中它從來沒有得到比對方多的分數它不可能在一局中比對方得分更多,因為它總是讓對方先背叛,並且它從來不會比對方的背叛次數多。它的勝利,不是靠比對方做得好,而是靠引導出對方的合作。用這個方式,「一報還一報」靠促進雙方的利益而不是靠剝削對方的弱點來取得勝利。一個有道德的人也就不過如此了。使「一報還一報」有點令人不舒服的是它堅持「以牙還牙」。這確實只是大致公平的。而且,它的麻煩在於一旦結下仇恨,它就會無休止地繼續下去。確實,許多仇恨似乎都有這種性質。例如,世界上很多宗族觀念和民族矛盾強烈的地區,家族之間的仇恨有時持續了幾十年。一個傷害由另一個傷害來償還,並且每一次報復都引起了一輪新的報復。這種傷害來回反射直到最初的暴行消失在遙遠的過去中。這是「一報還一報」的嚴重的問題。一個更好的策略可能是一報還9/10報。這樣既能夠減弱衝突的振蕩,又能提供一個激勵使對方不敢嘗試無緣無故的背叛。它是一個基於回報的但又比「一報還一報」多一點寬容的策略。它也是大致公平的。但是在一個自私自利的沒有集權的世界裡,它確實不僅促進它自己的福利,而且增加其他人的福利。自我控制的特性給你一個額外的激勵去把它傳授給別人,即使這些人決不會與你打交道。自然,你想把回報教給那些你將打交道的人以便你能建立一個雙方都有好處的關係。但你也可以從那些你決不會與他們相遇的採用回報策略的人那裡得到你個人的好處,即其他人的回報懲罰了那些試圖占人家便宜的人,這有助於控制整個社會。並且,它減少了你將來必須對付的不合作的人的數目。啟示:一個採用基於回報的策略的社會確實能夠自我控制。由於確保了對試圖不合作的懲罰,那些不合作的策略就得不到好處。改進辨別能力從過去的接觸中識別對方,並從中發現對方是否可信的能力對合作的持續是必要的。例如,細菌幾乎是進化階梯底層的生物。只有很有限的識別其他生物的能力,所以它們必須通過捷徑來識別,即在一個時間內只和一方(寄主)建立關係。在這種方式下,細菌環境的任何變化都可以歸咎於對方。鳥類有更強的辨別力,它們可以通過鳴叫聲識別鄰居。這種識別力使得它們能夠與其他若干的鳥建立合作關係或者至少避免過分的衝突。而人類的辨別能力已經發展到了在他們的大腦中有一個專門的部位來識別面孔的程度。這種識別曾經接觸過的個體的能力使得人類可以發展比鳥類更豐富的合作關係。然而,即使在人類事務中,合作範圍的限制往往是由於不能識別其他人的特徵和行為而造成的,這裡的困難在於核實,即是否有足夠的信息確認對方所真正採取的步驟。並不是每個佔便宜者都是光明正大的,這使我們在識別之時碰到了一些困難,但是我們也會承認,人的名聲往往是和他的真實個性相符的,經過偽裝的侵犯仍然是容易識別的,特別是當它一而再,再而三地施展時。識別背叛什麼時候發生的能力不是產生成功合作的惟一要求,但它肯定是一個重要的條件。因此,通過改善對策者的基於過去的接觸而相互識別的能力和確定以前已經發生過的行為的能力,持續合作的範圍可以得到擴展。我們已經說明了人們之間的合作能夠通過各種技巧來促進。它們包括:未來的影響,改變收益值,教育人們關心他人的福利和教人懂得回報的價值。促進好的結果不僅要告訴對策者:雙方合作比雙方背叛的所得更多,而且還是一個明確相互作用的特徵從而得到一個長期的穩定的合作進化的問題。啟示:持續合作的範圍取決於辨別能力。例如,鳥類可以通過鳴叫聲識別鄰居,這種識別力使得它們能夠與其他鳥建立合作關係至少避免過分的衝突。而人類的辨別能力更強。這種識別曾經接觸過的個體的能力使得人類可以發展比鳥類更豐富的合作關係。第4章 戰爭法則:廟算在先有「談笑間,強虜灰飛煙滅」的指揮大師,但也同樣有「紙上談兵」的「藝術家」,有沒有什麼東西可以更可靠地告訴我們,在什麼情況下運用某種原則有效,以及為什麼有效?其實,在「藝術」和「技術」之間,我們可以找到清晰的規律。戰爭是藝術還是技術翻開歷史我們會發現,儘管戰爭在人類史上(甚至早至史前時代)佔有重要地位,人類對戰略、戰術基本原則的注意力卻遠不及發明新式武器所投注的心力。的確,過去有2500多年前中國的《孫子兵法》,300多年前的拿破崙定理,直至近代的克勞塞維茲信條,以及口號式的句子如:「搶佔高地」、「兵貴神速」、「分兵佔領」、「合圍聚殲」等等,這些在某些戰爭中的確有用,不過令人驚訝的是,即使是人們普遍信奉的這些原則,都似乎很少有人做過科學系統的分析,也極少公開發表過任何量化的研究。我們常常聽到「戰爭藝術」這個詞,似乎戰爭也像藝術一樣,難以言傳,無法用數據衡量。的確,戰爭的進程離不開指揮官的直覺、靈感甚至運氣(中途島海戰中,就是一批誤打誤撞的美軍轟炸機打亂了日本人的計劃),但是如果一味指望這些即興發揮式的東西贏得勝利,恐怕只能是痴人說夢。我們有過「談笑間,強虜灰飛煙滅」的指揮大師,但也同樣有過「紙上談兵」的「藝術家」,有沒有什麼東西可以更可靠地告訴我們,在什麼情況下運用某種原則有效,以及為什麼有效?當然,技術的進步也是一個必須考慮的因素。因為一些聰明的指揮官引用了(有時甚至發明了)新式武器,使戰略與戰術不時會出現一些質的創新:從公元前1000年把馬匹帶進戰鬥,到近代火槍、大炮的使用,以及最近的核阻嚇戰略等。隨著電腦時代的來臨,許多軟體公司致力於發展戰地模擬、實戰遊戲,這些新產品已大量用來訓練軍事人員。儘管如此,有關戰時的決策原則還是鳳毛麟角,而通過在戰場上嘗試錯誤學會決策要領(「在戰爭中學習戰爭」)可是要付出可怕代價的。其實,戰術決策和其他決策一樣,都會涉及心智修鍊,這也是決策理論的核心所在。如果面對善於思考的對手,這就屬於賽局理論的範疇,雖然並不那麼明顯易辨,但在對手的戰略意圖和戰術動作十分明顯的情況下,簡單的策略就很有用。身為航空、汽車史的先驅,英國工程師藍徹斯特也是把正規學術訓練用於戰術研究的學者之一,其理論基礎來自於研究第一次世界大戰的空中戰役。可惜他卓越深入的研究僅有少數現代軍官知曉,因為雖然軍事院校課程中都曾提到,不過卻很少得到重視。啟示:美國影片《華爾街》中,邁克爾·道格拉斯扮演的黑心大亨告訴他的下屬:看看《孫子兵法》吧,戰爭的勝負在開火之前就已經決定了。他指的是《孫子兵法》中「未戰而廟算(事先評估局面)勝者,得算多也」以及「勝兵先勝,而後求戰;敗兵先戰,而後求勝」的戰略思想。藍徹斯特定律藍徹斯特定律提供了一個基本的戰略思考原則。他設想了一個戰鬥模式(當然已過度簡化),敵對雙方彼此互相射擊,而且雙方在準確性、人員、武器等各方面都勢均力敵(第一次世界大戰以及前期與近期的戰鬥,常出現這類無意義的戰事)。藍氏最重要的見地是指出在這類戰鬥中,我方軍隊、船隻、戰機的攻擊火力和敵人的攻擊目標都跟我方軍隊數量成正比。因此,軍隊數量決定了我方的攻擊力:一方面增加自己的命中率,另一方面則分散對方的攻擊火力。而藍氏的基本假設就是雙方互射的命中率雖然低但都不是零。軍方用一個冗長拗口的名稱來表達對這種練習的崇高敬意:「擾亂阻進式射擊」。到最後,會出現兩種重大結果,這不難用數學算出來。第一種結果是以軍隊數量的平方來代表我方的軍力,只要數量超過敵軍,其中的好處肯定出乎眾人意料之外。若我方軍隊數量多於敵軍3倍(軍隊、飛機、船艦、坦克等),就可以產生9倍於對方的戰力。當然你會說在電視電影中,英俊強壯的好人通常可以只手打敗六七個壞蛋,不過現實生活中可沒有這種事。平方定律是指所有人同時發動攻勢,不像電影情景,壞人輪番上陣跟好人對打(肯定讓自己後悔的戰術),好讓英雄可以各個擊破,自己卻毫髮無傷。如此一來,藍徹斯特定律當然不成立。另一種藍徹斯特定律不成立的情況是一方的武力強過另一方,比如拳擊重量級冠軍可以輕而易舉、大氣不喘地撂倒幾個手無縛雞之力的人,一個拿著一枝衝鋒槍的士兵可以輕易制服一群手無寸鐵的平民。軍事專家喜歡稱這類先進武器或技巧為「武力乘數」。不過如果所有條件都成立,平方定律就會產生極大功效。啟示:倚多為勝,人海戰術等是古代的戰略之一,然而在現代戰場、商場、運動場上,又該如何有效運用手中資源,擊敗競爭對手?藍徹斯特定律提供了一個基本的戰略思考原則。分散敵軍,各個擊破你一定知道許多戰爭中「以少勝多」的例子,這些例子似乎是違反上述原則的。可是,如果你仔細分析一下這些戰例,可能會發現:其中只有極少部分是通過以劣勢兵力與對方的優勢兵力正面決戰而獲勝的,這種勝利又往往取決於某些特殊情況,如天時、地利,或對手只是一群烏合之眾,或者是自己一方戰鬥力超強。更多的情況是:劣勢一方的統帥善於高效率使用他的少數部隊,他往往通過巧妙地設置假象使對手判斷錯誤,分散兵力,然後各個擊破。也就是說,雖然從雙方總的實力對比來說,勝利一方處於劣勢,但在每一場具體的戰役中,卻都是以優勢兵力擊敗對方的劣勢兵力。如果藍徹斯特原則正確無誤的話,那麼又該如何把決策智慧用於戰術呢?如果你手下有15支軍隊,而敵方則有17支,兩方士兵戰鬥力相當,兩方的武器與地理位置並無優劣之分,而人數方面你則處於劣勢。因此,你的軍隊會全軍覆沒,因為15的平方是225,17的平方是289,兩者相減之後是64,也就是在戰鬥後,敵軍還會殘留8支隊伍。當然對方的損失不可謂不小,因為他失去了一半以上的隊伍;不過你會更慘,就此成為「歷史」。如果敵軍認為值得,他肯定會這麼做。然而,你有沒有可能在藍氏定律下仍取得勝利呢?如果能分散敵軍,以全力先擊敗一部分,便可獲全勝。假設你能成功地把對方的12支軍隊先引出來,然後用自己全部的15支隊伍來攻擊敵方,而另外5支敵軍還在睡鄉,或正苦於找不到戰役所在。根據藍氏定律,225減去144是81,因此你可以擊敗這12支敵軍,還有9支隊伍存活下來。雖然耗損掉40%的兵力,損失很慘重,不過你還是贏了。然後再去解決敵軍剩下的5支軍隊,而這時候由於你仍保有9支軍隊,因此在數量上還是佔了優勢。等到所有戰役結束,你可把原具優勢的敵軍全部殲滅,而仍保有近一半的軍隊。因此,雖然你的軍隊比對方少,但若能成功地運用平方定理,將敵軍以正確的方式分成兩部分,即可獲得最後的成功。所有軍事人員都知道分散敵軍戰術的重要性,並稱之為滲透或集中原則,但他們仍停留在概念層次上。這對於我們來說是一個非常有用的原則。當可利用資源有限時,必須學會「集中優勢兵力」這一戰術原則,將你的時間、精力、才能、金錢等投入最有希望獲勝的戰場,確立自己在這一領域的優勢地位。你的每一場勝利都使雙方的實力對比發生變化,這樣不斷「積小勝為大勝」,直至取得全局性優勢時,「最後的決戰」也就勝券在握了。在歷史上,軍隊投降多半不是因為被擊敗,而是因為自以為被擊敗,因此,甚至有可能去說服強勢的一方,讓他們自以為已經失落。例如「淝水之戰」中,正是東晉的內應朱序在前秦軍中散布失敗消息,使得這支百萬之眾的大軍人心惶惶,在東晉的猛烈攻擊下土崩瓦解。啟示:提到戰爭史,就不能不說拿破崙,只不過這一次我們要說的是他「走麥城」的例子:滑鐵盧戰役。本來「分散敵人,各個擊破」戰術是可能幫助他打贏這一仗的,可惜的是,最後他恰恰又輸在這上面。他在英軍到達之前打敗了普魯士軍隊,但未將對方消滅,為了把這支敗軍趕得遠些,他分出部分軍隊追擊。可是這支部隊沒能追上普軍,也沒能及時趕回,導致拿破崙在英、普聯軍的合擊下失敗。合則兩利,分則兩害藍氏定律是應用於兩軍互射的戰役上,那麼同樣的原則是否也能運用在三方軍隊彼此互相攻擊的戰役?這時出現兩種極端的可能性:其一,大家彼此互射,沒有朋友,都是敵人;其二,兩軍聯合,共同對抗第三勢力。用個具體例子來說明,並稍微設計一下數字,以簡化答案。假設敵對三方分別為A、B、C,各有45、40、35個單位的軍隊(坦克、軍隊、戰機皆可),開始射擊在藍氏定律下,每位士兵都會向目所能及的陌生人開火,無論其屬於哪一方。當塵埃落定,軍隊數少的一方定會被全面消滅,而A與B則各剩40與20個單位的軍隊。不僅軍隊最少的一方會成為歷史,第二大勢力B,比起A也是損失慘重。B約會喪失一半的軍力,而A不過從45減少到40,所以A可以在少量損失的狀況下,輕而易舉除掉B。因此對多數的一方來說,採取隨意射擊是很有利的,而B和C互射的結果就是等於間接幫了A軍隊。假設B和C兩軍將領都知道這種狀況,於是決定以結盟的方式,聯手對抗A,至於兩軍如何處理他們之間的歧見,容後再談。於是聯軍共有75個單位,遠遠超過A軍,僅需要耗損其中的15個單位即可擊敗A軍,這當然比白白犧牲要強得多,也同時說明軍事聯盟這麼受歡迎的主要原因。當然,未必每次聯盟都能這麼成功。因為結盟雙方都很清楚,他們很快就必須攤牌,因此多會有所保留。同樣的,第二次世界大戰時,蘇、美、英盟軍類似此例。還有一個有待解決的問題,在B和C共同與A對決時,彼此的相對損失如何,這會影響到下一次戰鬥時雙方的情勢。同樣地,這個數學計算太過繁瑣,不過結果是雙方將分別損失20%,因此B的40個單位會剩下32個單位,而C的35個單位則剩下28個單位。在聯盟的情形下,成為歷史的就是A。B與C則在共同行動中,分別失去同比例的軍力。而在接下來的戰役中,B會獲勝,不過損失慘重,原來45個單位,大約只會剩下15或是16個單位,所以他可能會因為損失過大而覺得不值得和C決戰。從三方競賽中兩方結合是有利的這個原則,可引申到多人參與的遊戲當中,而過去的經驗也證實了這一點。防守還是進攻從前面的討論中,我們已經了解了優勢兵力左右戰局的巨大作用。但是僅僅擁有優勢兵力還不夠,你還必須學會使用它,否則,你就可能敗在實力不如你的對手面前。為什麼會這樣?《孫子兵法》中有一句「守則不足,攻則有餘」,歷來為人所歧解。一種意見認為:這句話的意思是,「(在戰爭中)採取守勢,是因為實力不足;採取攻勢,是因為實力有優勢。」這一派的代表人物是三國時代最傑出的戰略家之一曹操,他的註解是:「吾所以守者,力不足也;所以攻者,力有餘也。」的確,從戰略的角度看,進攻的一方通常是比較強大的。但是也有另外一種意見認為:這句話的意思是,「(一定的兵力)用來防守則不足,用來進攻則有餘。」因為這樣解釋不僅更符合古代漢語的語法規律,而且更符合孫子強調「善戰者,制人而不制於人」的積極戰術原則。孫子在《虛實》篇中的一段精彩論述可以作為這一戰術思想的註解:「故形人而我無形,則我專而敵分。我專為一,敵分為十,是以十攻一也,則我眾而敵寡……吾所與戰之地不可知,不可知而敵所備者多,敵所備者多,則我所與戰者寡也。故備前而後寡,備後則前寡……無所不備,則無所不寡。」大致意思是:使敵人兵力部署被固定,而我軍機動;使敵人兵力被分散,而我軍專一,就可以取得「以十攻一」的優勢。敵人越弄不清我要進攻哪裡,就越要到處設防,無論如何設防都難免顧此失彼,而一旦到處兼顧,則到處都是薄弱環節。從古今中外戰史看,以弱勝強的例子不少,但消極被動防禦很少能堅持到最後勝利,弱小一方都是通過主動進攻扭轉戰局的。例如游擊戰的「十六字訣」,再如解放戰爭時期「三大兵團」大鬧中原都是如此。「不列顛之戰」中英國似乎是被動防禦的成功例子,但正是英國空軍對柏林的主動出擊,打亂了希特勒的戰略部署,希特勒一怒之下,將原定的「全力摧毀英國空軍」的目標改為對英國城市的狂轟濫炸,才使英國擺脫了戰敗的命運。啟示:圍棋中有一名言「寧輸十子,不輸一先」也是這個意思:寧可損失部分實力,也不能失去戰爭主動權。屬於拿破崙的1/4世紀所謂主動權,就是可以決定在何時何地作戰,有了這個主動權,就可以投入主要兵力戰鬥。而沒有這個主動權的一方,由於不知道要在哪裡作戰,也就難以在戰場上投入全部實力,這樣即使總體實力強於對方,也難免被各個擊破。上面我們談到了拿破崙「走麥城」,如果只談這一點,可能對這位卓越的軍事家不太公平。就整體表現而言,拿破崙幹得相當不錯——在整整1/4世紀的時間內(1791-1815年)橫行歐洲大陸,所向披靡。在這個廣闊的舞台上,拿破崙以其傑出的軍事指揮才能導演了許許多多有聲有色、威武雄壯的戰役,其中多數戰役都是以少擊眾,以劣勢對優勢而獲勝。都是先以局部的優勢和主動,向著敵人局部的劣勢和被動,一戰而勝,再及其餘,各個擊破,全局因而轉成了優勢,轉成了主動。拿破崙為什麼能夠在義大利戰役以及馬侖哥、奧斯特里茨、耶拿、弗里德蘭、瓦格拉姆戰役中取得輝煌的勝利?拿破崙在義大利戰役中(1796年),以一支裝備極差的3萬人的軍隊,在一年時間內同反法聯軍進行了14次會戰、70次戰鬥,全部獲勝,而且殲滅敵軍25萬人。他為什麼能成功?首先,拿破崙認為作戰行動的目標是消滅敵軍兵力。他說:「在歐洲有很多好的將領。但是他們一下子期望的東西太多。我看見的只有一個——敵軍的兵力,我全力去消滅它,因為我確信,隨著敵軍兵力的被殲滅,其他一切也隨之而崩潰。」其次,拿破崙為了消滅敵軍兵力,奪取戰役的勝利,堅持集中優勢兵力的原則,確立軍事上的優勢。再次,拿破崙為了保證在必要的時間和必要的地點集中比敵人在同一時間、同一地點優勢的兵力,經常在及時準確掌握戰場軍事行動的基礎上,利用敵人的失策,投入自己的作戰部隊。拿破崙擁有善於發現敵人失策的敏銳洞察力,並以閃電般的速度給敵人以毀滅性的打擊,是他獲取勝利的重要因素之一。司令,下命令吧美國普林斯頓大學「博弈論」課程中有這樣一道練習題:如果給你兩個師的兵力,你來當司令,任務是攻克「敵人」佔據的一座城市。而敵人的守備是三個師,規定雙方的兵力只可整師調動,通往城市的道路有甲、乙兩條,當你發起攻擊時,若你的兵力超過敵人你就獲勝;若你的兵力比敵人守備部隊兵力少或者相等,你就失敗。你如何制定攻城方案?乍一看來,你可能要說:「為什麼給敵人三個師的兵力而只給我兩個師?這太不公平。兵力已經吃虧,居然還要規定兵力相等則敵勝我敗,連規則都不公平,完全偏袒敵人。」在這個遊戲中,假設守方的兵力比進攻方多,而且同等兵力也較強是有道理的,因為防守方確實要佔一些便宜,比如以逸待勞、依託工事等,另外,進攻方集結兵力、投入戰場,都不如守方那樣方便(比如空投、渡河作戰,都要受制於交通工具的運載能力);而且面對堅固防禦,至少在戰鬥開始的時候,攻方總要承受很大的犧牲。模擬作戰中規定若攻守雙方兵力相等則失敗,就體現了這個意思。其實,這次模擬「作戰」,每一方取勝的概率都是50%,即誰勝誰負的可能性是一半對一半。能否指揮隊伍克敵制勝,還得看雙方的策略得失。為什麼說取勝的概率是一半對一半呢,讓我們先學一點兒「紙上談兵」。敵軍有三個師,它有四套作戰方案:A.三個師均守在線路甲;B.兩個師守甲線路,一個師守乙線路;C.一個師守甲線路,兩個師守乙線路;D.三個師均駐守乙線路。同樣,我軍有兩個師的攻擊兵力,可以有三套作戰方案:1.集中全部兩個師的兵力從甲線路實施攻擊行動;2.兵分兩路,一個師從甲線路,一個師從乙線路進城;3.集中全部兵力從乙線路進城。戰果如何?啟示:任何時候,只要可能,我們必須做最有成效的事情。公平還是不公平現在我們先把問題修改一下,既然你抱怨敵人比你多一個師很不公平,那麼就先減掉敵人一個師,看看有什麼不同。敵人的選擇由四個變成了三個:A.全力防守甲;B.全力防守乙;C.分兵把守甲、乙。你的選擇未變,還是三個。你一定發現,無論敵軍怎樣布防,你的勝利幾率都達到了2/3。如果敵人採取A,全力防守甲,你全力進攻甲,失敗;而全力進攻乙或分兵進攻都勝利。敵人採取B,你全力進攻乙,失敗;而全力進攻甲或分兵進攻均勝利。敵人採取C,只要你不分兵,無論進攻甲、乙,都能獲勝。由此你會明白,為什麼同樣的兵力「守則不足,攻則有餘」的道理了,以及為什麼要多給敵人一個師才公平了。現在,讓我們回到原來的問題,看看敵人在三個師的情況下會如何布防。注意:敵人不可能採取用三個師全力防守甲或乙的方案(即A和D),因為布置三個師和兩個師的效果是完全一樣的。所以敵軍必取B或C那樣的二一布防,一路兩個師,另一路一個師。也就是說,敵軍的選擇其實只有兩個。既然如此,你就不可能採取分兵進攻的策略,因為那樣一定失敗。所以,你的選擇其實也只有兩個:全力進攻甲或乙。情況最終就是這樣:我軍必集中兵力於某一路出擊。這樣,你若攻在敵軍的薄弱之處,你就獲勝,你若攻在敵人兵力較多的地方,你就失敗。總之,敵我雙方獲勝的可能性還是一樣大。這雖然是一個模擬的例子,卻具有相當的現實意義。從表面看來,防守一方似乎佔了很大便宜,兵力比對方多,而且每一單位兵力也比對方強,為什麼結果只是勉強和對方打成平手?進攻方又是拿什麼抵消掉這些劣勢的呢?很簡單,就是那「一先」:戰場主動權——可以決定何時何地開戰。啟示:我們應該相信自己經常面對某種選擇——而且大部分的主控權操控在自己手上——這是邁向均衡,步入再生的墊腳石。「攻防博弈」——諾曼底登陸二戰期間,蘇聯與美英成為盟國,共同對抗納粹德國。蘇聯方面一再要求美英同盟國及早在歐洲大陸開闢第二戰場。1944年春天,英美聯軍在北非戰場上徹底摧毀了德國隆美爾元帥的抵抗,德軍已經完全收縮到歐洲大陸,盟軍在歐洲西部開闢第二戰場的時機終於成熟了。當時可供盟軍渡海登陸的地點有兩個:一個是塞納河東岸的布隆涅——加來——敦刻爾克一帶,這裡海峽最狹窄的地方只有幾十公里,是一個理想的登陸地點;另一個是塞納河岸的諾曼底半島,但是這裡海面較寬闊,渡海時間將比較長,比較容易被德軍發現。當時,德軍在歐洲西線的總兵力近60個師,但是要布防的海岸線長達3千英里。顯然,德軍不可能把這些兵力沿海一字排開,只能把主要兵力放在它認為盟軍最有可能渡海登陸的地方。同時,盟軍在英國集結能夠用於渡海作戰的兵力,由於受登陸艦船容量的限制,數量也有限,只能考慮集中有限的兵力重點進攻一個地方。所以,無論是對於盟軍還是對於德軍,選擇和判斷盟軍將在哪裡登陸,已經成為這次跨海作戰成敗的關鍵。守備歐洲大陸西海岸的德軍西線有兩個司令官,一個是出身貴族、有「德國最後一位戰略家」美譽的倫德施泰特元帥,另一個是屢建奇功的新貴、「沙漠之狐」隆美爾元帥。他們都估計到盟軍即將渡海進攻,但是在判斷盟軍的登陸地點上卻各執一詞。倫德施泰特認為兵貴神速,盟軍多半會取道海峽較窄的加來一帶急速渡海登陸,這一帶正是倫德施泰特駐防的地方。而曾經在北非沙漠跟英國蒙哥馬利元帥和美國巴頓將軍鏖戰多時的隆美爾,憑直覺判斷盟軍將在他主布防的諾曼底一帶登陸,主張在這一帶集中兵力。在旁觀者看來,兩位元帥都認為應該重點加強自己的防區,雖然他們各有分析、各有理由,卻還是難免有「屁股指揮腦袋」的成分:駐守在什麼地段,就論證自己這個地段重要。在具體戰術上,倫德施泰特和隆美爾也有很大分歧。倫德施泰特主張「縱深防禦」,即先把登陸盟軍放進來,再發動強大反擊,圍殲盟軍的有生力量。隆美爾則清楚戰局已經逆轉,認為圍殲盟軍有生力量的目標無法實現,覺得最好的辦法只有在發現盟軍即將搶灘登陸之際,即趁其立足未穩,迎頭予以痛擊。為此,隆美爾要求給諾曼底增派裝甲師。這一請求沒有被處在兩個元帥之間態度模稜兩可的希特勒接受。其實,盟軍頻頻發出迷惑性的電報,製造即將發動在廣闊海岸線上全面進攻的假象,使希特勒過高估計了盟軍將用於渡海作戰的兵力,認為即使是在諾曼底一帶登陸,也不過是在從加來到諾曼底的廣闊海岸線上全面進攻的前奏。這也是希特勒優柔寡斷沒有聽取隆美爾的意見去全力加強諾曼底防禦力量的一個原因。由於德軍分兵布防,而盟軍攻其一點,諾曼底登陸獲得勝利。從此德國陷入兩線作戰的困境,敗局已經不可逆轉了。啟示:諾曼底登陸是世界軍事史上的空前壯舉。盟軍各路大軍滿懷信心順利東進,蘇聯大舉反攻而迅速西進,使德國腹背受敵,從而決定了其徹底失敗的命運。至此,第二次世界大戰進入了粉碎納粹德國的最後決戰階段。如何提高勝利幾率好了,現在我們已經知道,在「攻城戰博弈」中,作為進攻方,你有50%的勝率,但是你不希望把勝利寄託給老天幫忙——你是個軍事家,不是賭徒。你該怎麼選擇呢?你當然希望進攻對手的弱點,但前提是你要知道對方的弱點在哪裡。也就是說,你要掌握準確的情報。孫子說:知己知彼,百戰不殆。了解自己的優勢,同時洞悉對手的弱點,你就會獲得勝利。這也就是軍事領域的「情報戰」或「信息戰」。信息戰分兩方面:一、了解對手信息;二、保證自己的信息不被對方了解。還記得孫子所說的「形人而我無形」嗎?說的正是這個道理。所謂「形人」就是使對手的機動兵力變成僵化的陣勢,一舉一動都在我掌握之內;而我「無形」就是兵力保持機動狀態,使敵人無法做出正確判斷。如何做到「形人而我無形」呢?孫子說:「兵者,詭道也。故能而示之不能,用而示之不用,近而示之遠,遠而示之近……攻其無備,出其不意。」諾曼底登陸就是一個「形人而我無形」、「攻其無備,出其不意」的成功戰例。儘管德軍早就知道盟軍一定會在法國沿岸登陸,並派出間諜刺探盟軍作戰計劃,但一直未能獲得準確情報。盟軍的情報戰更高一籌,不但保守住了機密,同時還通過利用雙料間諜傳遞假消息、在加來對岸部署假軍營、讓當時被解職的巴頓拋頭露面等手段,大放煙霧彈,使德軍如墮五里霧中。另一方面,盟軍對德國軍隊的防禦部署卻比較了解。不但成功破譯了德軍的密碼系統(二戰時期,許多天才數學家參與了這一工作)、有法國抵抗組織和秘密特工源源不斷傳送情報,而且還通過早期的佯攻探明了敵軍防禦重點。在掌握戰場氣候、環境信息方面,盟軍也走在了德軍前面:登陸作戰開始時,德軍指揮官隆美爾元帥沒在現場,因為他得到的情報是「天氣惡劣,盟軍無法進攻」。於是他決定趁此機會回國治病,並爭取希特勒給他增派援軍。然而,盟軍的氣象專家卻更準確地預測到6月6日天氣將好轉。當隆美爾得知登陸戰開始時,他嘆息道:「我真蠢!」啟示:一隻山豬在大樹旁勤奮地磨獠牙。狐狸看到了,好奇地問它,既沒有獵人來追趕,也沒有任何危險,為什麼要這般用心地磨牙。山豬答道:「你想想看,一旦危險來臨,就沒時間磨牙了,現在磨利,等到要用的時候就不會慌張了。」第5章 皮洛斯的勝利人們都追求勝利,但不是所有勝利都值得追求。所謂「皮洛斯的勝利」指的就是「得不償失的勝利」。在投入一場戰爭之前,你必須計算成本與收益的比例。昂貴的戰爭《孫子兵法》的《作戰》篇中,一開始並未探討戰略或戰術問題,而是算賬——一次軍事行動(無論勝敗)的成本:「日費千金」的人力、物力投入。宋代的沈括也算過一筆細賬:動用10萬軍隊到遠方作戰,運送輜重的兵員要佔1/3,而後勤補給人員至少需要30萬,這樣一支部隊,最多只能行軍16天。三個民夫供應一個士兵,這已經是最大極限了。如果用牲畜運糧,固然負載多而費用少,但很容易生病死亡,這樣連牲畜和馱負的物資都要白白丟棄,所以比起人力運輸,利弊各半。所以,「因糧於敵」(從敵人那裡獲取給養)就非常重要。通過長途運輸一份軍糧,可能在路上要消耗好幾份。孫子說:「食敵一鍾,當我二十鍾。」正是這個原因。現代戰爭由於交通的便利,可以節省某些成本(如糧食的運輸消耗),但是其他方面(如彈藥的大量消耗)的花費比古代要昂貴多了,海灣戰爭中美軍發射的一顆導彈動輒價值數十萬甚至上百萬,這種高技術戰爭不是哪個國家都能承受的。在古代兵法中,有「堅壁清野」,在現代軍事史上,也有「焦土政策」,它們的共同點是儘可能減少對方從戰爭中獲得補償,也就是提高對方的戰爭成本。當然,實行這一戰略,自己的損失也很大,不過也不失為一種有效的策略。而且,這一行動也是在向對方表明立場:我要和你干到底,為此我寧願作出任何犧牲,不要指望從我的屈服中獲得什麼好處。戰爭如此,市場競爭如此,甚至我們日常行為也都面臨一個成本—效率問題。理想狀態當然是以儘可能小的成本,換取儘可能大的效用,但是現實中大多數選擇並非理想。啟示:打仗是一件花錢的事,所以古人有云:「兵聞速拙,未睹巧久。夫兵久而國利者,未之有也。故不盡知用兵之害者,則不能盡知用兵之利也。」「每個人都有自己的價錢」在英國作家威廉·薩克雷的名作《名利場》中,女主角貝姬曾經這樣表白自己:「如果我一年有5000英鎊的收入,我想我也會是一個好女人。」赫胥雷弗教授在他的《價格理論與應用》中,就貝姬的上述表白,出過一個思考題:如果這個表白本身是真實的,即貝姬每年有5000英鎊收入的話,在旁人看來她就真變成一個好女人,那麼人們至少還可以有兩種解釋:一、貝姬是想做好女人的,但是她太窮,所以做不了好女人。如果貝姬每年有5000英鎊的收入,她就會恢復好的本性。二、貝姬本來並不願意做一個好女人,就像不想辛勤勞動一樣,但是如果有人每年給她5000英鎊作為補償,為了這些錢,看在這些錢的份上,她也就勉為其難,願意做一個好女人。怎樣知道這兩種可能中哪一種符合實際呢?怎樣才能知道貝姬的本性究竟是「好」的還是「壞」的呢?為了不干擾你的思路,可以先撇開道德判斷。例如,不妨把「做好女人」理解為某種行為舉止規範或者必須遵守的限制。避免好惡,有助於得出比較客觀的結果。以上面的「成本」定義來看貝姬的選擇就很容易得到答案。5000英鎊,就是她為「做好女人」開出的價錢,如果5000英鎊是一筆小錢,說明她認為「做好女人」的成本不高,換言之,就是她喜歡做個好女人,只要能維持生活下去就可以;如果5000英鎊是一筆大錢,說明她認為「做好女人」的成本(即必須放棄的某種東西)很高,非用一大筆錢補償不可。那麼5000英鎊是不是大錢呢?不要忘了,那是100多年前,英鎊比現在要值錢得多,稍晚的作品《福爾摩斯》中,說一個女人只要「有60鎊的年金」,就可以過得去了。用這個標準看,貝姬開的價不能算低。啟示:我們常常談到成本,那麼究竟什麼是成本?經濟學家的定義是:成本就是為了得到某種東西而必須放棄的東西。皮洛斯的勝利現在我們已經有了成本觀念,下面就是應用問題了。在作決策之前,必須經過「成本估算」:如果得大於失,就值得做;如果得失相抵、甚至得不償失,就不要干這種「吃力不討好」的事了。西方有一個成語「皮洛斯的勝利」,意思就是:代價慘重、得不償失的勝利。贏得戰爭(或避免戰爭)的一個有效策略就是增加對方的戰爭成本,使其難以堅持,或因為得不償失而放棄發動戰爭的願望。「田忌賽馬」就是一個通過讓對手多付代價而獲得勝利的例子。田忌的上、中、下三等賽馬都比齊王的同等級賽馬差,可是在著名軍事家孫臏的幫助下,田忌以「下駟對上駟、上駟對中駟、中駟對下駟」的策略,在平均劣勢下贏得了對國王的賽馬勝利。為什麼能獲勝?關鍵在第一場——也就是輸掉的那一場。齊王雖然勝了,但是卻付出了巨大的成本——上駟與下駟的實力差距被白白浪費掉了,因此他輸掉了後面兩場。這是一個重要的原則:你支付的成本越大,局面就越不利。「田忌賽馬」的故事,用現代術語來說就是一個典型的博弈問題。實際上,它是通過增加對方的成本改變雙方的實力對比,並最終取得勝利的。圍棋上也有類似技巧,任何好的棋手都不希望把棋「走重」,因為這樣不但效率低,而且包袱沉重,一塊重棋在遭到攻擊時是很難辦的:苦苦求活吧,難免受到對手的百般盤剝;可乾脆放棄又損失太大,所以這種棋往往被稱為「愚形」。啟示:皮洛斯是古羅馬時期的一位國王。在一場血腥的戰鬥中,他獲得了勝利,卻損失了大半精銳部隊。望著屍橫遍野的戰場,他感慨道:再來這樣一場勝利,我就完蛋了。斜坡上的均衡拿出一張1元鈔票,請大家給這張鈔票開價;每次叫價以5分為單位;出價最高者得到這張1元鈔票,但出價最高和次高者都要向拍賣人支付相當於出價數目的費用。你打算怎麼玩這個遊戲?如果你沒想得更遠,就很容易上當。你可能這樣想:不就是一元錢嗎?只要我的出價低於面值,我就賺了,我所能出的最高價是95分,再往上就沒有利潤空間了,誰還會繼續出價呢?美國耶魯大學的教授們在課堂實驗上,跟毫無疑心的本科生們玩這個遊戲,很是賺了一點錢,至少足夠在教工俱樂部吃一兩次午飯。圈套是這樣:開始你參加競價是為了獲得利潤,可是後來就變成了避免損失。假定目前的最高叫價是60美分,你叫價55美分,排在第二位。出價最高者鐵定賺進40美分,而你卻鐵定要丟掉55美分。如果你追加競價,叫出65美分,你就可以和他掉換位置。哪怕領先的叫價達到3.60美元而你的叫價3.55美元排在第二位,這一思路仍然適用。如果你不肯追加10美分,「勝者」就會虧掉2.60美元,而你則要虧掉3.55美元。這是光滑斜坡的又一個例子。一旦你開始向下滑,你就很難回頭。最好不要邁出第一步,除非你知道自己會去到哪裡。假如不幸,已經邁出了第一步,還有沒有什麼方法讓我們避免更大的損失?這個遊戲或博弈有一個均衡,即從1美元起拍,且沒有人再追加叫價。不過,假如起拍價低於1美元又如何?這樣的層層加價可是沒完沒了,惟一的上限就是你錢包里的數目。至少在你掏空錢包之後競爭不得不停止。這正是我們需要用到這個法則——向前展望、倒後推理的地方。假定伊萊和約翰是兩個學生,現在參加1美元拍賣。每人各揣著2.50美元,而且都知道對方兜里有多少錢。為了簡化敘述,我們改以10美分為叫價單位。從結尾倒推回來,如果伊萊叫了2.50美元,他將贏得這張1美元鈔票(同時卻虧了1.50美元)。如果他叫了2.40美元,那麼約翰只有叫2.50美元才能取勝。因為多花1美元去贏1美元並不划算,如果約翰現在的價位是1.50美元或1.50美元以下,伊萊只要叫2.40美元就能取勝。如果伊萊叫2.30美元,上述論證照樣行得通。約翰不可能指望叫2.40美元就可以取勝,因為伊萊一定會叫2.50美元進行反擊。要想擊敗2.30美元的叫價,約翰必須一直叫到2.50美元。因此,2.30美元的叫價足以擊敗1.50美元或1.50美元以下的叫價。同樣,我們可以證明2.20美元、2.10美元一直到1.60美元的叫價可以取勝。如果伊萊叫了1.60美元,約翰應該預見到伊萊不會放棄,非等到價位升到2.50美元不可。伊萊固然已經鐵定損失l美元60美分,不過,再花90美分贏得那張1美元鈔票還是合算的。第一個叫1.60美元的人勝出,因為這一叫價建立了一個承諾,即他一定會堅持到2.50美元。我們在思考的時候,應該將1.60美元和2.50美元的叫價等同起來,視為制勝的叫價。要想擊敗1.50美元的叫價,只要追叫1.60美元就夠了,但任何低於這一數目的叫價都無濟於事。這意味著1.50美元可以擊敗60美分或60美分以下的叫價。其實只要70美分就能做到這一點。為什麼?一旦有人叫70美分,對他而言,一路堅持到1.60美元而確保取勝是合算的。有了這個承諾,叫價60美分或60美分以下的對手就會覺得繼續跟進得不償失。我們可以預計,約翰或伊萊一定會有人叫到70美分,然後拍賣就會結束。雖然數目可以改變,結果卻並非取決於只有兩個叫價者。哪怕預算不同,倒後推理仍然可以得出答案。不過,關鍵一點是誰都知道別人的預算是多少。如果不知道別人的預算,可以猜到的結果是,均衡只存在於混合策略之中。當然,還有一個更簡單也更有好處的解決方案:聯合起來。如果叫價者事先達成一致,選出一名代表叫10美分,誰也不再追加叫價,全班同學就可以分享90美分的利潤。你當然可以把這個例子當成耶魯本科生都是傻瓜的證明。不過,超級大國之間的核裝備升級過程難道與此有什麼分別嗎?雙方都付出了億萬美元的代價,為的是博取區區「1美元」的勝利。聯合起來,意味著和平共處,它是一個更有好處的解決方案。啟示1:有一群動物在討論如何使自己成為更好的通才,展現自己多才多藝的本事,於是兔子開始學習魚兒游泳,當然,魚兒也要學兔子跳躍,同樣,飛鳥必須學習跑,松鼠也得學習飛……一段時日之後,兔子不但學不會游泳,連自己最拿手的「跑」也變慢了;魚兒忘了如何力爭上遊;鳥兒也失去了在空中自由自在飛翔的樂趣——認識自己,正確選擇,這是最重要的。啟示2:通過不斷地修正想法、物體或過程,你就會逐漸把任務縮小為核心的部分。例如,如果你去掉一輛坦克作戰的那些部分,你就會創造出一輛履帶拖拉機。「騎虎難下」與「協和謬誤」一旦進入騎虎難下的博弈,及早退出是明智之舉,然而當局者往往做不到,這就是所謂當局者迷。這種騎虎難下的博弈經常出現在國家之間,也出現在企業或組織之間,當然個人之間也經常會碰到的。20世紀60年代,美國介入越南就是一個騎虎難下的博弈。賭紅了眼的賭徒輸了錢還要繼續賭下去以希望返本,也是騎虎難下的博弈,其實,賭徒進入賭場開始賭博時,他已經進入了騎虎難下的狀態,因為,賭場從概率上講是肯定贏的。股票市場也經常出現「騎虎難下」的情況:你買進一隻股票,股價下跌;於是你又在這個價位買進(股民稱此為「攤平」),可是它又下跌……你再次購買的本意是減少損失,可是卻越陷越深。博弈論專家經常將這種「騎虎難下」的博弈稱之為協和謬誤。20世紀60年代,英國和法國政府聯合投資開發大型超音速客機,即協和飛機。開發一種新型商用飛機簡直可以說是一場豪賭。單是設計一個新引擎的成本就可能高達數億美元。想開發更新更好的飛機,實際上等於把公司作為賭注押上去。難怪政府會被牽涉進去,竭力要為本國企業謀求更大的市場。該種飛機機身大、設計豪華並且速度快。但是,英法政府發現:繼續投資開發這樣的機型,花費會急劇增加,但這樣的設計定位能否適應市場還不知道;而停止研製將使以前的投資付諸東流。隨著研製工作的深入,他們更是無法作出停止研製工作的決定。協和飛機最終研製成功,但因飛機的缺陷(如耗油大、噪音大、污染嚴重等等),成本太高,不適合市場競爭,最終被市場淘汰,英法政府為此蒙受很大的損失。在這個研製過程中,如果英法政府能及早放棄飛機的開發工作,會使損失減少,但他們沒能做到。不久前,英國和法國航空公司宣布協和飛機退出民航市場,才算是從這個無底洞中脫身。這也是「壯士斷腕」的無奈之舉。貿然發動的第一次中東戰爭在解決國際爭端方面,為什麼談判比戰爭要好?一方面談判的成本比戰爭的要低;另一方面,戰爭會打開衝突、傷害和仇恨的魔瓶,正如神話中說的那樣:魔鬼一旦被放出瓶子,就很難再把它關進去了。和平比戰爭可取的另一個重要原因是戰爭後果的不可預見性。也許在今天看來戰爭是有利的,但是明天的局面可能讓你悔不當初。在這方面,第一次中東戰爭就是一個例子。中東地區銜接亞、非、歐三大洲,並擁有豐富的石油資源,戰略位置十分重要。巴勒斯坦則位於中東的中心地帶,長期以來,一直是強鄰和大國爭奪的主要目標。猶太人古時稱為希伯來人,他們和阿拉伯人都是西亞古代閃族的後裔。公元前1000年,猶太人在巴勒斯坦建立了統一的希伯來王國,可是後來歷經亞述帝國、巴比倫王國、波斯、希臘、羅馬等外族輪番佔領,猶太人從此也逐漸疏散。特別是在史稱「猶太戰爭」的反抗羅馬人入侵的三次武裝起義失敗後,猶太人幾乎全部逃離和被驅逐出巴勒斯坦,結束了猶太民族主體在巴勒斯坦生存的歷史。猶太人在離開巴勒斯坦之後,流散到世界各地,受到種族歧視、迫害甚至屠殺。幾百年間,歐洲出現了一次又一次的「排猶運動」,被屠殺的猶太人不計其數。特別是納粹德國的「種族滅絕」使600萬猶太人遭到屠殺。戰後,在國際社會的同情下,猶太復國主義運動達到高潮。1947年11月29日,「聯大」通過了巴勒斯坦分治決議。規定英國對巴勒斯坦的委任統治結束後在巴勒斯坦建立阿拉伯國和猶太國;耶路撒冷成為一個在國際政權下的獨立主體,由聯合國管理。分治決議一通過,巴勒斯坦阿拉伯人和阿拉伯國家紛紛反對。在耶路撒冷和一些阿猶混合的城鎮,爆發了猶太人和阿拉伯人之間的激烈武裝衝突。戰爭一開始,阿拉伯國家軍隊在數量和裝備上比以色列部隊略佔優勢,處於十分有利的地位,以色列軍隊節節敗退,已處於崩潰邊緣。但以色列最大限度地利用停火,擴充兵員,採購武器,進行軍事改組,為爾後的戰爭作準備。7月9日,經過充分準備的以色列軍隊向阿拉伯軍隊發動攻擊,奪取了阿拉伯約1000平方公里的土地,改善了自己的戰略地位。在第二次停火期間,以色列大力推行移民計劃,不斷擴充軍隊和武器裝備。相反,阿拉伯國家在第二次停火期間內部矛盾進一步激化,戰局每況愈下,到了不可扭轉的地步。此後,以色列軍隊又破壞停火令,向阿拉伯軍隊主動進攻,首先逼迫埃及要求停戰,並同樣使約旦、黎巴嫩和敘利亞簽訂停戰協定。巴勒斯坦戰爭共歷時15個月,以阿拉伯國家的失敗,以色列獲勝而告終。除加沙和約旦河西岸部分地區外,以色列佔領了巴勒斯坦4/5的土地,比聯合國分治決議規定的面積多了6700多平方公里。戰爭中近百萬巴勒斯坦人淪為難民。聯合國決議所規定的阿拉伯國家始終未能建立。戰爭激化了阿拉伯國家和以色列、美、英的矛盾。這次戰爭的另一後果是開了這兩個民族武力解決爭端的先河,在接下來的30年間,阿以之間又爆發了四次大規模戰爭,以色列佔據了大片原屬阿拉伯國家的領土,並在這些領土上建造了大批定居點。造成了佔有這些領土的既成事實。如果第一次中東戰爭沒有爆發,阿拉伯國家不可能蒙受如此巨大的損失。啟示:1948年5月14日,「以色列國」宣告建立,本·古里安任總理兼陸軍總司令。他上任伊始就瘋狂叫囂,猶太國的命運「只能在戰場上決定」。阿拉伯國家堅決反對這個人為製造出來的「國家」。5月15日,阿拉伯聯盟五個成員國——埃及、伊拉克、敘利亞、黎巴嫩和約旦,向以色列宣戰,於是第一次中東戰爭爆發。「焦土政策」與「破釜沉舟」前面我們已經談過「焦土政策」的兩個作用:顯示自己決不妥協的立場和增大對手的成本。不過,這裡倒不是有意暗示說,這麼一個策略無論成功或失敗,其本身或結果都是可取的。不難想像社會希望避免這麼一種意味著巨大浪費的破壞行動的出現。我們的目的在於解釋這些策略的本質,這樣你就可以更好地運用它們,或者避免使用它們。焦土防禦只不過是被博弈論者稱為策略行動的做法的一個例子。你大約已經覺得,保留選擇餘地總歸是有好處的。不過,在博弈論的王國里,這一點卻不成立。你雖然少了自由,卻在策略上得了益。因為這麼做改變了其他參與者對你以後可能採取什麼反應的預期,而你可以充分利用這一點,為自己謀利。其他人知道,只要你有行動的自由,你就有讓步的自由。「破釜沉舟」、「背水一戰」、「置之死地而後生」等成語,說明的都是這個道理:只有把退路堵死,你才能奮勇向前。為了使一個策略行動可信,你必須採取其他附加行動,使扭轉這一行動變得代價高昂乃至完全沒有可能。可信度要求對這個策略行動作出一個承諾。當戰爭中的一方威脅要餓死他的敵人,燒毀田野的行動就使他的威脅變得非常可信。而在其他情況下,可信度是一個程度問題。(大多數時候)法律體系中的先例使強制判刑條例顯得可信;至於政治家的承諾,例外情況反而更加常見。啟示:策略行動包含兩個要素:計劃好的行動路線以及使這一路線顯得可信的承諾。威脅與許諾一個無條件的行動(不計代價、只要勝利)可以使這個參與者獲得策略上的優勢,搶佔先機,率先出招。即便你並未真的先行,仍然可以通過對一個回應規則提出一個承諾,獲得相仿的策略優勢。雖然你是跟在別人後面行動,但這個回應規則必須在別人開始行動之前就實施。父母對孩子說:「除非你做完作業,否則不許出去玩。」實際上就是在確立一個回應規則。毫無疑問,這個規則必須在這個孩子跑出去之前就開始實施,並且明確宣布。威脅是對不肯與你合作的對手進行懲罰的一種回應規則。既有強迫性的威脅,比如恐怖分子劫持一架客機。其確立的回應規則是假如他的要求不能得到滿足,全體乘客都將死於非命。也有阻嚇性的威脅,比如美國威脅說,假如蘇聯出兵攻擊任何一個北約國家,它就會以武力回敬。強迫性威脅的用意在於促使某人採取行動,而阻嚇性威脅的目的在於阻止某人採取某種行動。兩種威脅面臨同樣的結局:假如不得不實施威脅,雙方都要大吃苦頭。第二大類的回應規則是許諾。這是對願意與你合作的人提供回報的方式。檢察官會向一個被告許諾說,只要他願意成為公訴方的證人,檢舉同案中的其他被告,他就會得到寬大處理。許諾同樣可以分為強迫性的和阻嚇性的兩種。強迫性許諾的用意是促使某人採取對你有利的行動,比如讓被告搖身一變成為公訴方的證人;阻嚇性許諾的目的在於阻止某人採取對你不利的行動,比如黑幫分子許諾好好照顧證人,只要他答應保守秘密。相仿地,兩種許諾也面臨同樣的結局:一旦採取(或者不採取)行動,總會出現說話不算數的動機。有時候,威脅與許諾的界限非常模糊。威脅與許諾的界限只取決於你怎樣稱呼當前的情形。老派的歹徒會威脅說,假如你不給他一點銀子,他就要加害你。假如你沒有給,他就會動手「修理」你,從而造成一種新的情形,而在這種新的形勢下,他又會許諾說只要你給他一點銀子,他就會住手。隨著形勢轉變,一個強迫性的威脅會變得和一個阻嚇性的承諾差不多;同樣,一個阻嚇性的威脅與一個強迫性的許諾的區別也只限於當時的情況。如果實踐一個「威脅」對你有利,我們稱之為警告。比如,一位總統告訴他的國會議員們,如果國會不能通過他提出的法案,他就要解散國會,重新舉行大選。這就是一種威脅。警告的用意在於告知其他人,他們的行動將會產生什麼影響。如果實踐一個「許諾」對你有利,我們稱之為保證。孩子不理會關於爐子頂部很熱的警告,結果燙傷了,這使父母得到某種保證,知道孩子以後再也不會這麼幹了。我們強調這兩對概念的區別是有理由的。威脅與許諾是真正的策略行動,而警告與保證更多的是起一個告知的作用。警告或者保證不會改變你為影響對方而設立的回應規則。實際上,你只不過告知他們,針對他們的行動,你打算採取怎樣的措施作為回應。與此截然相反,威脅或者許諾一旦時機來臨,就會改變你的回應規則,使之不再成為最佳選擇。這麼做不是為了告知,而是為了操縱。由於威脅和許諾表明你可能選擇與自身利益衝突的行動,這就出現了一個可信度的問題。等到別人出招之後,你就有動機打破自己的威脅或者許諾。為確保可信度必須做出一個承諾。無條件的行動是你先行且行動一成不變的回應規則。威脅與許諾則在你第二個出招時出現。兩者都是有條件的行動,因為這個回應是由取決於對方怎樣做的規則所確定的。一種策略行動總是搶佔先機的行動。回應規則必須在對方行動之前實施,在博弈當中進行分析。如果你永不妥協,那麼整個博弈都必須當做相繼出招的過程,那麼其他人就會針對你採取無條件的行動。無條件行動若是打算用來影響對方,就一定要讓對方看到,同樣你打算通過威脅或許諾影響他的行動,那麼他的行動也要讓你看到。否則你不可能知道他是不是選擇順從,而他也明白這一點。除了前面提到的三種基本的策略行動,還有更多更加複雜的選擇。這些選擇包括:你可以任由別人在你做出回應之前採取一個無條件行動;你可以等待別人發出一個威脅,然後再採取行動;你可以等待別人提出一個許諾,然後再採取行動。有些時候,本來可以先行的一方放棄這一便利,讓對方做出一個無條件的行動,反而能取得更好的結果,這樣的例子我們已經探討過了。若是在跟隨比帶頭更好的關頭,這麼做當然是明智的選擇。不過,雖然放棄先行之便可能更加有利,但這麼做卻並非一個基本規則。有時候你的目的可能是阻止你的對手作出一個無條件的承諾。古代戰略家孫子曾經給過這樣的提示:「圍師遺闕」。只要留下出口,敵人就會認定還有逃生機會。假如敵人看不到任何逃跑的出口,就會迸發破釜沉舟般的勇氣,頑抗到底。孫子的目的就是不給敵人對自己作出一個拚死戰鬥的非常可信的承諾的機會。讓別人有機會對你發出一個威脅永遠不是好事。你大可以選擇按照對方的希望行動,卻沒有必要等到聽見一個威脅。不錯,你若不聽話,但這一事實並不能作為你坐等對方發出一個威脅的借口。注意,這句格言只限於允許對方發出威脅而已。假如對方同時作出威脅和許諾,那麼雙方都會得到更好的結果。啟示:一切威脅與許諾的共同點在於:回應規則使你不會在沒有回應規則的前提下採取行動。由於別人對你以後的行動的預期毫無變化,這個規則也就產生不了任何影響。不過,說明什麼事情會在沒有規則的情況下發生,仍然具有一種公告天下的作用,這些說明稱為警告與保證。許諾與威脅的適度原則顯而易見,在你作出一個許諾的時候,你不應讓自己的許諾超過必要的範圍。假如這個許諾成功地影響了對方的行為,你就要準備實踐自己的諾言。這件事做起來應該是代價越小越好,因此也意味著許諾的時候只要達到必要的最低限度就行了。不那麼容易看到的是,適度原則其實同樣適用於威脅。你不應讓自己的威脅超過必要的範圍。這麼做的理由相當微妙。為什麼美國不會威脅日本說,假如日本不同意進口更多的美國大米、牛肉和柑橘,美國就要動武呢?雖然動武的想法有可能博得美國一些農場主和政治家的歡心,但同時卻存在幾個很好的理由,說明不能這麼做。1.沒有人會相信這麼一個威脅,因此這個威脅不會奏效。2.哪怕這個威脅真的管用,日本也不傻,一定會重新揣摩美國究竟是不是它的盟友。3.假如日本不肯進口更多柑橘,美國說到做到,當真實施自己的威脅,其他國家就會譴責美國選擇了一個很不恰當的懲罰方式,日本更會怒不可遏。不過,假如美國不實施自己的威脅,又會讓自己日後的信譽大打折扣。無論是不是實施自己的威脅,美國都將遭到失敗。4.這個威脅由於引入了一個本來毫不相干的因素——武力——而使原來的問題變得模糊不清。上述各點的核心在於,這個威脅大而不當,對方難以置信,而自己又不能說到做到,更別說進一步確立自己的信譽了。博弈的參與者發出威脅的時候,首先考慮的問題可能恰恰相反,認為威脅必須足夠大,大到足以阻嚇或者強迫對方的地步。接下來要考慮的則是可信度,即能不能讓對方相信,假如他不肯從命,一定逃脫不了已經明說的下場。若是在理想狀況下,再沒有別的需要考慮的相關因素了。假如受到威脅的參與者知道反抗的下場,並且感到害怕,他就會乖乖就範。那麼,我們為什麼還要擔心若實施這個威脅,會有多麼可怕的情況發生呢?問題在於,在這個方面,我們永遠不會遇到理想狀況。只要我們仔細考察美國不能威脅動武的理由,我們就會看得更清楚,現實與理想狀況究竟有什麼區別。首先,發出威脅的行動本身就可能代價不菲。國家、企業乃至個人都參加著許多不同的博弈,他們在一個博弈中的行動會對所有其他博弈產生影響。比如美國若是威脅對日本動武,就會影響到美國日後與日本的關係、目前和日後與其他國家的關係,而美國用過這麼一個大而不當威脅的事情也會留在別人的記憶里。別人在和美國打交道時就會猶豫不決,美國則會失去許多其他貿易和夥伴關係帶來的好處。其次,一個大而不當的威脅即便當真實施了,也可能產生相反的作用。日本會驚慌失措地高舉雙手投降,請求世界輿論聲援,譴責美國,從而將大大推遲有關談判的進度;美國本來希望迫使它儘快開放國內市場,結果卻適得其反。再次,所謂一個成功的威脅完全不必實施的理論,只在我們絕對有把握不會發生不可預見的錯誤的前提下成立。假設美國錯誤地判斷了日本農場主的勢力,而他們寧可讓國家投入戰爭也不願失去自己受到保護的市場。又或者,假設日本同意美國的條件,可是美軍某指揮官想起自己當年不幸淪為戰俘的慘痛經歷,就會抓住這個機會報仇雪恨……面對發生諸如此類錯誤的可能性,美國應該三思而後行,在考慮作出一個很大的威脅的時候更應如此。最後,在討論過以上幾點後,我們可以看到,一個威脅可能由於太過而喪失可信度。假如日本不相信美國當真願意實施這個威脅,這個威脅就不可能影響它的行動。結論是,能奏效的最小而又最恰當的威脅應該成為美國的首要選擇,務必使懲罰與罪行相適應。如果美國希望刺激日本多買柑橘,就應該選擇一個更具互惠性質的威脅,使懲罰與不肯多買柑橘的做法更加匹配。比如,美國可以威脅說要削減日本汽車或者電器的進口配額。啟示1:實際上,這種威脅曾在1853年使用過。美國海軍上將佩里的龐大戰艦編隊成功地懾服日本幕府時代的將軍,使後者同意向美國商界開放日本市場。今天,日本把美國由於要求開放日本市場而施加的過分壓力稱為「黑色艦隊」。啟示2:有些時候,一個合適的威脅簡直得來全不費工夫。而在其他時候,我們眼前只存在大而不當的威脅,必須縮小其範圍才能考慮加以採納。「冤冤相報」到「兩敗俱傷」在「囚徒困境」中,我們已經了解這樣一個道理:如果你總是想贏對方,結果可能得不償失。因為對方也會全力反擊,造成「兩敗俱傷」的局面。而且,敵對一旦形成,雙方都難以全身而退。這個時候,即使雙方都沒有繼續對抗下去的意願,可還是只能咬牙堅持,這真是對人類理性的一大嘲弄。即使是「一報還一報」這種有效破解「囚徒困境」的理想策略,也難免陷入「兩敗俱傷」的危險。當「一報還一報」策略糾纏在一起時,將陷入「循環報復」的局面,難以脫身。由於「一報還一報」的核心就是對任何行為都要給予及時有效的回報,當遭遇他人侵犯時一定會以牙還牙;當然,這種策略的前提是「不主動侵犯他人」,這大大降低了它們相互傷害的機會。但是,這種前提是理論性的。在一個規則明確的遊戲里它也許可以得到完美的遵循,但在現實生活中,各種社會關係、各種慾望和利益衝突的複雜性,使「不主動侵犯他人」這一限定條件變得模糊不清了。也許你認為自己只是在以正當手段謀求個人的利益,或者只是奉命行事,可是有人會認為你已經侵犯到了他的權益,他有權作出報復。而受到報復的你會認為對方是無端挑釁,同樣也作出反擊。由此,就很容易形成雙方相互懲罰對方的「侵犯」、冤冤相報的局面,而可悲的是,這場也許會使雙方毀滅的爭鬥並沒有一個清晰的理由。這樣的悲劇在人類歷史中可以說層出不窮。過去的家族間世代血仇有的可以持續上百年,雙方的每次衝突都會激發新的仇恨,而兩家最初的仇恨緣由也許根本無人知曉。國家和民族間也有同樣的問題,甚至到了今天仍可以表現出來。如巴以衝突中,為了抗議「以色列的侵略行為」,「哈馬斯」等激進組織利用「人體炸彈」襲擊以色列平民;而為反擊這種「恐怖行為」,以色列出動軍隊「定點清除」,每一次攻擊的報復都給雙方心中增添了一份仇視和不信任,也給問題的和平解決增加了難度。人們都同意,為了從上述那種冤冤相報的麻煩中解放出來,人們應該「拋棄過去,面向未來」。可是這一原則在現實中應用卻困難重重,因為放棄武力威懾不但意味著情感和利益上的損失,而且在互不信任的境況里,也很難保證得到對方的善意回應。人們之所以相互仇視和傷害,僅僅是因為他們無力擺脫「威懾與反威懾」的怪圈。為了解決它易被挑起報復的缺點,學者們建立了一些改良方法。這些改良方法更多一點寬容,要麼容忍對方偶爾的侵犯行為,直到這種行為屢次出現,並且超出預定的次數或比例之後,才採取報復行動。要麼降低報復強度,如對10次背叛只報復9次。並根據對方的一貫表現決定寬容程度。啟示:有一個人和朋友在住家附近的商店買東西,他禮貌地對店員說了聲:「謝謝!」但店員卻臭著一張臉,沒有理會。他們走出商店時,朋友說:「那傢伙服務態度很差。」這個人對朋友說:「他每天都是這樣。」朋友說:「既然他每天都是這樣,那你為什麼還對他那麼客氣呢?」這個人回答說:「為什麼我要讓他的態度來決定我的行為呢?」不能取勝,就該謀和許多比賽結局都是「零和」的:有人贏,就有人輸。但是在社會關係中,並不總是這樣。當然,人們都希望取勝,可是當取勝無望時,那麼爭取到「平局」也不錯,至少比輸要好。在現代社會,多數競爭已不再是「你死我活」的,從「地球上抹掉敵人」的情況少之又少。博弈論告訴我們:當人們必須長期共處時,合作和妥協往往是明智的選擇。既然難以「畢其功於一役」,我們就該把目光放長遠一些。「妥協」是雙方或多方在某種條件下達成的共識,在解決問題上,它不是最好的辦法,但在沒有更好的方法出現之前,它卻是最好的方法,因為它有不少的好處。首先,它可以避免時間、精力等「資源」的繼續投入。在勝利不可得,而「資源」消耗殆盡時,妥協可以立即停止消耗,使自己有喘息、整補的機會。也許你會認為,「強者」不需要妥協,因為他「資源」豐富,不怕消耗。問題是,當弱者以飛蛾撲火之勢咬住你時,強者縱然得勝,也是損失不少的「慘勝」,所以強者在某種狀況下需要妥協。其次,可以借妥協的和平時期,來扭轉對你不利的劣勢。對方提出妥協,表示他有力不從心之處,他也需要喘息,說不定他根本要放棄這場「戰爭」;如果是你提出,而他也願意接受,並且同意你所提的條件,表示他也無心或無力繼續這場「戰爭」,否則他是不大可能放棄勝利的果實的。因此「妥協」可創造「和平」的時間和空間,而你便可以利用這段時間來引導「敵我」態勢的轉變。再次,可以維持自己最起碼的「存在」。妥協常有附帶條件,如果你是弱者,並且主動提出妥協,那麼可能要付出相當的代價,但卻換得了「存在」;「存在」是一切的根本,沒有存在就沒有未來。也許這種附帶條件的妥協對你不公平,讓人感到屈辱,但用屈辱換得存在,換得希望,也是值得的。「妥協」有時候會被認為是屈服、軟弱的「投降」動作,但若從上面所提幾點來看,「妥協」其實是非常務實、通權達變的智慧,智者都懂得在恰當時機接受別人的妥協,或向別人提出妥協,畢竟人要生存,靠的是理性,而不是意氣。何時「妥協」?怎樣妥協?要看狀況:第一,要看你的大目標何在,也就是說,你不必把資源浪費在無益的爭鬥上,能妥協就妥協,不能妥協,放棄戰鬥也無不可。但若你爭的本就是大目標,那麼絕不可輕易妥協。第二,要看「妥協」的條件,如果你佔據優勢,當然可以提出要求,但不必把對方弄得無路可退,這不是為了道德正義,而為了避免逼虎傷人,是有利害權衡的。如果你是提出妥協的弱勢者,且有不惜玉石俱焚的決心,相信對方會接受你的條件。總之,「妥協」可改變現狀,轉危為安,是戰術,也是戰略。啟示1:妥協:用讓步的方法避免衝突或爭執。啟示2:妥協是現代社會關係中的重要謀略。在商場競爭中,一個經營者如果不懂得適當妥協,就會在盲目前進中碰壁。同樣,一個不知進退的人早晚也會嘗到失敗的苦果。第6章 應對危機的策略人類最理智的時候,往往就是別無選擇的時候。「邊緣策略」是一場危險的遊戲,每一步都蘊藏著巨大的希望與危機。 肯尼迪的邊緣策略 從前面的分析中,我們似乎得出這樣的結論:立場堅定、不留餘地是一個高明的策略。那麼它是不是永遠有效?下面我們將討論與之不無矛盾的情況。 1962年10月,古巴導彈危機將整個世界拖到了爆發核戰爭的邊緣。蘇聯在赫魯曉夫的領導下,開始在古巴裝備核導彈,那兒距離美國本土只有90英里。美國總統肯尼迪隨即宣布要對古巴實施海上封鎖。假如蘇聯當時接受這一挑戰,此次危機很有可能升級為超級大國之間一場傾巢而出的核戰爭。肯尼迪本人估計,發生這種情況的可能性「介於13到一半之間」。不過,經過幾天的公開表態和秘密談判,赫魯曉夫最後還是決定避免正面衝突。為挽回赫魯曉夫的面子,美國做了一些妥協,包括最終從土耳其撤走美國導彈。作為回報,赫魯曉夫則下令拆除蘇聯在古巴裝備的導彈,並且裝運回國。 你可以說赫魯曉夫貿然在古巴部署導彈是魯莽的,但不能不說他的妥協是明智的(據說那些日子,肯尼迪緊張得幾乎崩潰,如果赫魯曉夫不肯退讓,一場核戰爭似乎不可避免);但是反過來說,既然赫魯曉夫最終只有退讓這一個明智選擇,那麼他最初的冒進就是鹵莽的。 我們普通人也會運用邊緣政策,只不過不會產生那麼深遠的國際影響罷了。比如買賣雙方的討價還價最終變成一場爭吵;固執己見而不能達成妥協的夫妻可能離婚;意見不一的合作者如果不能相互協作,合作關係就會破裂。這些案例的雙方其實都會用到邊緣政策。他們故意創造和操縱著一個有著在雙方看來同樣糟糕的結局的風險,引誘對方妥協。 邊緣政策是一個充滿危險的微妙策略,假如你想成功地運用這個策略,你必須首先徹底弄明白它究竟是怎麼一回事。 啟示:「邊緣政策」一詞看來就是為這麼一種策略設計的,這種策略將你的對手帶到災難的邊緣,迫使他撤退。肯尼迪在古巴導彈危機中採取的行動,被普遍視為成功運用邊緣政策的典範。 懸崖還是斜坡 這裡還是以古巴導彈危機作為案例,幫助你把握邊緣政策中的微妙之處。 肯尼迪政府發現蘇聯偷偷在古巴裝備導彈,立即詳細考慮了一系列可能的行動:什麼也不做;向聯合國投訴(這一行動的實際效果幾乎就等於什麼也不做);實施封鎖或隔離(這是實際選擇的方案);向古巴的導彈基地發動空中打擊;要麼就是走極端,搶先向蘇聯發動一場全面的核打擊。 而在美國實施海上封鎖後,蘇聯也有很多可能的回應方式。它可以退讓,並拆除導彈;停止通過大西洋運輸導彈(這是實際選擇的方案);挑戰美國的封鎖線;或者走極端,搶先向美國發動一場全面的核打擊。 在這一系列的行動與反行動里,一些可能的行動很顯然是安全的(比如美國什麼也不做或者蘇聯撤走導彈),而另外一些行動則帶有明顯的危險性(比如向古巴發動一場空中打擊)。不過,在這麼大的範圍里,我們怎麼知道安全在哪兒終結,而危險又從哪兒開始呢?換言之,古巴導彈危機的邊緣在哪裡?是不是存在一條邊界線,世界在這一邊是安全的,一旦落到另一邊就要遭受滅頂之災? 答案當然是並不存在這麼一個精確的臨界點,人們只是看見風險以無法控制的速度逐漸增長。舉個例子:假如蘇聯企圖挑戰美國的封鎖,美國不大可能立即發射自己的戰略導彈。但整個事件的緊張程度無疑會上升到一個新的水平,而人們的情緒也會變得越來越激動,可以預見,世界遭受滅頂之災的風險也加大了。要想透徹地理解邊緣政策,關鍵在於,必須意識到這裡所說的邊緣不是一座陡峭的懸崖,而是一道光滑的斜坡,它是慢慢變得越來越陡峭的。 實際上,邊緣政策是一種威脅,只不過屬於非常特殊的類型。要想成功運用邊緣政策,你首先必須了解其獨特之處。 我們通過三個問題分析這些獨特之處:第一,為什麼不直接用一種表示可怕結果一定會出現的確定性來威脅你的對手,而只是藉助一個單純的風險來暗示可怕的結果可能出現?第二,確定風險是不是已經過去的機制又是什麼?第三,這個風險的恰當程度應該如何把握?我們將依次回答這些問題。 啟示:邊緣政策的本質在於故意創造風險。這個風險應該大到讓你的對手難以承受的地步,從而迫使他按照你的意願行事,以化解這個風險。這麼一來,邊緣政策變成一個策略行動,目的是通過改變對方的期望來影響他的行動。 為什麼選擇不確定性 在美國希望蘇聯從古巴撤出導彈的前提下,肯尼迪為什麼不直接威脅說,假如赫魯曉夫不拆除那些導彈,他就會將莫斯科夷為平地?按照我們前面介紹的術語,這將是一個令人信服的威脅;它必須具體說明對方退讓的確切條件(將導彈撤回俄羅斯,還是裝箱後搬上哈瓦那港的一條船)以及退讓的最後期限。 問題在於,在實踐當中,這麼一個威脅不會有人相信,赫魯曉夫不相信,其他什麼人也不會相信。不錯,這個威脅中提到的行動將會引發一場全球性的核戰爭,但這個危險本身實在太誇張了,以至於讓人難以置信。假如導彈沒有在最後期限之前撤離,肯尼迪一定不願意將整個世界夷為平地,而更加願意考慮延長留給蘇聯的最後期限,推後一天,再推後一天,如此下去。 我們討論過提高威脅的可信度的幾個辦法。在目前這個案例的具體情況下,動用一個自動裝置看來就是最有把握的一個辦法。安裝一個「末日毀滅機」,專門監測對方有沒有越界,並由一套穩定的電腦程序確定了一系列具體條件,一旦滿足這些條件,這個裝置就會自動實施報復行動。 從理論上說,在理想的情況下,一切都會按照計劃發生。一台自動裝置的存在可以使這個威脅更加可信。結果赫魯曉夫退讓了,這個威脅不必付諸實施,世界就免遭了滅頂之災。假如某個威脅一定會奏效,那麼它永遠不必付諸實施,其規模大小並不重要,當真實施起來會讓你遭受多大傷害也沒關係。不過,在實施中,這個威脅能不能按計劃奏效你不可能有絕對把握。 實際上,可能出現兩種錯誤。第一,這個威脅可能失敗。假設肯尼迪對赫魯曉夫的心思的判斷是完全錯誤的。赫魯曉夫不肯退讓,於是那台可怕的「末日毀滅機」就會自動啟動,毀滅全世界,肯尼迪則會後悔當初居然安裝了這麼一個東西。第二,這個威脅即便在不應該付諸實施的時候也會實施。假設蘇聯退讓,但這個消息傳到「末日毀滅機」那裡的時候偏偏晚了那麼一點點。 由於這樣的錯誤永遠可能出現,肯尼迪一定不肯依賴於任何一個實施起來代價驚人的威脅。赫魯曉夫若是知道這一點,根本不會相信這樣的威脅,從而這些威脅也就不能阻嚇他或迫使他就範。肯尼迪可以宣稱有這麼一台自動發射機,這台機器已經得到授權,假如蘇聯直到星期一還沒有將導彈撤出古巴,它就要自行向莫斯科發射導彈;不過,赫魯曉夫可以肯定,肯尼迪一定還有一個象徵更高授權的按鈕,這個按鈕可以撤銷這台機器發出的發射命令。 雖然表明戰爭必然爆發的確定性的威脅並不能讓人信服,但表明戰爭可能爆發的風險或概率卻可以變得可信。假如赫魯曉夫不肯退讓,就會出現一種風險,而不是一種確定性,表明導彈可能發射。這種不確定性降低了這個威脅的程度,從而使美國覺得這個威脅比較容易承受,因此在蘇聯看來也更加可信。 這跟我們在前面所提到的另一個提高可信度的辦法相似,即小步前進。當時我們認為應該把一個大的承諾分解為一系列小的承諾。如果一個內部人員打算賣給報界一條很有價值的重要消息,他可能不願意僅憑報界的承諾就和盤托出,而是一點一點地透露,相應地,報界也會一筆一筆地付錢。同樣的原則也適用於威脅。在這裡,每一步都包含一定程度的風險。美國或蘇聯方面的每一次不讓步都會加大爆發世界大戰的風險;而他們的每一個小的讓步則都會減少這個風險。假如肯尼迪願意走得比赫魯曉夫更遠,那麼肯尼迪的邊緣政策就會取勝。 肯尼迪不能令人信服地威脅說他馬上就要發動一場全面的核打擊,但他可以通過某些正面交鋒令人信服地將這種風險提高到一個新水平。於是,赫魯曉夫再也不能認為肯尼迪的威脅只不過是說說而已;假如肯尼迪使自己面臨這樣的風險有助於促使蘇聯撤走導彈,那麼這麼做其實符合他的利益。假如赫魯曉夫認為這種水平的風險難以忍受,那麼邊緣政策就完滿地達到了目的:它使肯尼迪可以選擇一個大小更恰當的威脅,一個大到足以奏效而又小到足以令人信服的威脅。 我們還要考慮肯尼迪怎樣才能以爆發戰爭的風險而不是爆發戰爭的確定性威脅對方。這裡我們看到了前面提過的那道光滑的斜坡。 在與理性的對手較量時,沒人願意越過核戰爭的邊緣,卻有可能由於一個錯誤而滑下那道光滑的斜坡。 最常見的是採取超出你的控制的行動。這不是「假如你不服從我,就會出現我會這麼做的風險」的問題。相反,這是「假如你不服從我,就會出現不管到時候你我會不會感到後悔不迭都會發生這樣的事情的風險」的問題。 古巴導彈危機本身就提供了這麼一個例子:比如,即便是總統也可能發現,一旦實施海上封鎖,要想牢牢控制這一行動並不容易。 按照常規,封鎖是一種戰爭行為,不過,肯尼迪的目的是用某種方式勸說赫魯曉夫撤走,而不是刺激他採取報復行動。 海上封鎖的標準操作程序可能會施加超出肯尼迪計劃範圍的風險。因此,很重要的一點在於,認識到這種風險並非一個二人博弈,而蘇聯或美國也不能被看做是其中的一個個體參與者。肯尼迪的決策必須由自有一套程序的各方負責實施,這一事實使肯尼迪可以令人信服地表明確實會有一些事情超出他的控制。官僚機構自有一套行事方式,行動一旦發生就難以停止,以及組織內部存在相互衝突的目標,這些事實都是對肯尼迪有利的,他可以藉此威脅說他要啟動一個程序,而這個程序他自己也不能保證可以停止。 啟示1:肯尼迪上台後,在對蘇關係上靈活地使用了他的「兩手策略」。在1961年8月的第三次柏林危機中,他採取了強硬立場,向西柏林增派武裝部隊,迫使蘇聯讓步。在1962年10月的古巴導彈危機中,他採取了果斷而慎重的對策,終於迫使赫魯曉夫再次屈服。1963年8月,美蘇之間達成協議,在白宮和克里姆林宮之間建立熱線電話,避免由於誤會而爆發核戰爭。 啟示2:士兵和軍事專家常常談到「戰爭迷霧」,說的是雙方在溝通中斷、帶有恐懼或勇敢的心理以及存在很大程度的普遍不確定性的情況下採取行動。同一時間發生的事情太多,因而沒辦法一直將每一件事都牢牢置於自己的掌握之中。這對創造風險有一定幫助。 說還是不說 《哈姆雷特》有一句經典台詞:活還是不活?同樣,生於五、六十年代的人也幾乎從小都曾經歷過靈魂的拷問:說還是不說?它來自那個時代的老電影——在那些電影里,常有壞蛋把好人抓起來嚴刑逼供的情節。在那個時代,每個小孩都知道很多折磨人的玩意:辣椒水、竹籤子、老虎凳什麼的,也都思考過「說還是不說」這個問題(對於一個孩子來說,這種思考未免過於沉重了)。從小我們就懂得了什麼叫「生不如死」:在我們看來,與其挨揍,還不如馬上被槍斃好些。 儘管非常遺憾,但是在這裡必須承認嚴刑拷打比槍斃更有效:假如你想從某人嘴裡套出一些重要情報,你若威脅說他要是不招供你就會殺了他,你的威脅一定沒人相信。他知道,一旦殺了他,你想要的秘密會跟他一起埋葬,從而你就會失去兌現威脅的動機。 有一個海盜船長,想要他的俘虜說出財寶藏在哪裡,於是他拿出一把刀擱在這個俘虜的喉嚨上,以為這樣就可以使他招供。可俘虜還是默不作聲,船長的同夥反而笑起來,說:「假如你割斷他的喉嚨,他就沒法向你招供。他知道這一點,他也知道你知道這一點。」 假如這個海盜船長看過「硬漢派」偵探小說《馬爾他之鷹》,他本來也許可以扔掉那把刀子,轉而嘗試邊緣政策。在這本書里有這樣的情節:偵探藏起了那隻價值連城的鳥,而歹徒則絞盡腦汁要找出鳥藏在哪裡。 偵探說:「你想要那隻鳥吧,它在我的手裡……假如你現在殺了我,你又怎能找到那隻鳥?假如我知道你在得到那隻鳥之前殺不了我,你又怎能指望嚇唬我交出來?」 歹徒的回應是解釋他打算怎樣使自己的威脅變得令人信服。 「我明白你的意思。這需要雙方拿出最明智的判斷,因為你也知道,先生,男人若是急了,很快就會忘掉自己的最大利益究竟是什麼,那就什麼事都做得出來了。」 歹徒承認他不能以處死的辦法威脅偵探。不過,他可以讓偵探面對一種風險,即局勢可能在僵持到極點的時候超出控制,結果會是什麼就說不準了。也就是說,「我不是存心要殺你,可是你要找死我就沒辦法了。」歹徒不能承諾假如偵探不肯招供,他就一定大開殺戒。但他可以威脅說要讓偵探處於一種境地,在這種境地下歹徒自己也不能保證是不是可以防止偵探遇害。這種讓某人了解自己遭受懲罰的概率的本事應該足以使這個威脅奏效,假如懲罰足夠嚇人的話。 這麼一來,偵探喪命的風險越大,這個威脅就越管用。不過,與此同時,這個風險也會讓歹徒感到越來越難以承受,從而變得越來越難以置信。歹徒的邊緣政策在並且只在一個條件下奏效:存在一個中等程度的風險概率,它使這個風險大到足以迫使偵探說出那隻鳥的藏身之處,卻又小到讓歹徒覺得可以接受。這麼一個範圍只在偵探重視自己的生命勝過於歹徒重視那隻鳥的時候存在。 邊緣政策不僅在於創造風險,還在於小心控制這個風險的程度。 啟示:邊緣政策通常會是一個很管用的辦法,卻同樣可能變成某種冒險經歷。對於這個兩難問題,我們沒有任何完美的或普遍有效的答案。 毫無用處的核武器 許多人認為核武器存在一種悖論,因為核武器象徵的威脅太大(同歸於盡),以至於完全用不上。假如核武器的使用不是合理的,那麼所謂「核威懾」也不可能是合理的。這就跟放大了的歹徒與偵探的交易差不多。一旦失去了威脅的價值,核武器對阻嚇小型衝突也就毫無用處。 這就是歐洲人擔心北約的核保護傘可能抵擋不住蘇聯常規軍隊的原因。即便美國決心保衛歐洲,人們還是會繼續爭辯說,核武器根本就不可信。蘇聯可以運用每次切一小片的「義大利香腸」戰術,鑽核武器威脅的這個空子。 上世紀80年代,英國有一個很受歡迎的電視劇《是,大臣》,上至達官貴人,下至販夫走卒,都喜歡看這個拿政界人物開玩笑的節目,連當時的首相撒切爾夫人也樂於在其中客串角色。這個戲的主要內容是政客和官僚機構如何在扯皮中作出糟糕的決策。下面一段出自它的續集《是,首相》,正是一個「最後界限」為何失去作用的說明。 這一情節的背景是:首相正在猶豫是否要花費巨資裝備英國的核武庫,為此他找來了首席科學顧問,徵求他的意見。以下是這位首相的敘述。 他第一句話便問我是否相信有核威懾這回事。 是。我說。 「為什麼?」他問道。 我不知道該說什麼。我的意思是,人人都相信核威懾。我請他把問題再說一遍。 「為什麼?」他又問。 「因為……它發生威懾作用。」我軟弱無力地回答道。 「威懾誰?」 在我看來,這似乎很明顯。「俄國人。不能讓他們進攻我們。」 「為什麼?」他又來了,再次使用那個惱人的小小的詞「為什麼」。 為什麼威懾力量能威懾俄國人,不讓他們進攻我們——這是他的問題所在,他問的是這個問題。我堅定地回答道。「因為他們知道,如果他們發動進攻,我會按鈕。」 「您會嗎?」他聽來有些驚奇。 「哎……」我猶豫了一下,「我會不會?」 「唔……您會嗎?」 「作為最後一招,我會。肯定會。」我又想了一下說,「至少我認為我肯定會。」 他繼續無情地問下去。我不得不謹慎地想一想。 「那麼最後一招是什麼呢?」 「如果俄國人侵犯西歐。」這一點至少看來也是很明顯的。 羅森布拉姆教授微微一笑「可是您只有12個小時來作出決定,所以最後一招也是首先的反應,您所說的就是這個意思嗎?」 我所說的就是這個意思?看來瘋了。 那位首席科學顧問以挑剔的眼光盯著我看。「好吧,您不用擔憂。俄國人為什麼要吞併整個歐洲?他們甚至連阿富汗都控制不了。」他一邊說一邊搖頭,「不過,如果他們要幹什麼,那將是薩拉米香腸戰術。」 羅森布拉姆站起身來。他興奮地踱來踱去,手裡拿著一杯橘汁,闡述各種各樣的防衛方案。首先,他假設在西柏林發生暴亂,建築物處在火海之中,東德消防隊越過邊境來救火。他突然停止踱步,瞪著我,並問我在這樣的情況下我會不會按鈕。 很顯然,答覆是「不」。羅森布拉姆點點頭。他看來表示同意。然後他問我如果東德警察與消防隊一起進來,我會不會按鈕。我又搖搖頭。我怎麼可以由於這樣一個小小的領土侵犯行動而發動一次核戰爭昵? 羅森布拉姆又踱起步來。在他的嘴角上露出一絲微笑。「假定東德人派遣部隊,隨後再增加部隊——他們說不過是為了控制暴亂。接著俄國部隊來替代東德部隊。您會按鈕嗎?」 俄國部隊在西柏林替代東德部隊?我會不會發動一次核戰爭?我看不出我怎麼會這樣做。我又搖搖頭。 那位首席科學顧問又微微一笑,並高興地提出下一個俄國部隊拒不撤走的策略。部隊被「邀請」留下來支援民政管理。接著,民政管理署也許下令封鎖道路和滕珀爾霍夫機場。於是西柏林被切斷。他問道,現在我會不會按鈕呢? 我不知道。我對他說我需要時間來加以考慮。 「您只有12個小時!」他厲聲說。 我感到非常惶恐。然後我提醒自己和提醒他,這一切都出自他的虛構,說完了我感到輕鬆了一些。 羅森布拉姆教授轉身向我。他又開始說話了:「行。現在講設想二。俄國軍隊的策略是『出於偶然』,使士兵故意越過西德邊界……這是不是你所說的最後一招呢?」 「不,」我回答。看來還不是。 「好吧,」他很興奮地繼續說下去,「設想三:假設俄國人已經入侵和佔領了西德、比利時、荷蘭和法國;再假設他們的坦克和部隊已經到達英吉利海峽;再假設他們已布置就緒,準備入侵,這是不是最後一招?」 我設置障礙,說:「不。」 「為什麼不?」他問,「為什麼不?」 我腦子昏沉。我想從這一切中悟出道理來。「因為,」我支支吾吾地說,「因為……我們只能為了自衛而打仗。用自殺的辦法,我們又怎能自衛呢?」 「那麼,什麼才是最後一招呢?」瘦小的老教授微微一笑,他聳聳肩,靠在沙發里,「皮卡迪利?西沃特福德峽谷維修加油站?革新俱樂部?」 我凝視著他,想把我的思想整理一下。「如果你這麼說,」我對他說,「那麼,核威懾就沒有意義了。你是不是在說這個?」 整個入侵過程,攻方每次只增加那麼一點點分量,幅度那麼小,以至於守方根本沒有理由發動一場大的報復行動。北約就這樣一點一點重新確定自己的忍耐底線。最後,蘇聯人可能已經抵達倫敦特拉法爾加廣場,被迫逃亡的北約總部還在琢磨自己究竟在什麼時候錯過了反擊的機會。 啟示:「義大利香腸」戰術:對手為避開直接威脅,他會每次只切下一小片「香腸」,這樣他將不斷面對一個很小的遭遇滅頂之災的概率,但無論這一片有多小,都有可能成為引發萬劫不復災難的最後一片。 越「無能」,越成功 這個結論其實完全錯了。美國就蘇聯在歐洲的常規入侵發動核報復的威脅是邊緣政策之一。有兩個辦法可以繞過被迫重新確定忍耐底線的問題。這兩個辦法邊緣政策都會用到。 首先,你要設法讓懲罰措施的控制權超出你自己的控制,從而斷絕你自己重新確定忍耐底線的後路。其次,你要將懸崖轉化為一道光滑的斜坡。每向下滑一步都會面臨失去控制而跌入深淵的風險。 要使這種威脅變得可信,一個必不可少的要素在於:無論是你還是你的對手都不知道轉折點究竟在哪裡。美國通過創造一個風險,即哪怕政府本身竭盡全力防止,導彈還是可能發射出去的風險,成功地運用了邊緣政策。美國的威脅能不能付諸實踐與它本身的意願無關。核武器的威脅在於可能出現意外事故。當存在任何常規衝突都有可能使局勢激化到失去控制的可能性時,核阻嚇就變得可信了。這一威脅不是一定發生,而是一種同歸於盡的可能性。 赫魯曉夫在他的回憶錄中說:「古巴危機」期間,肯尼迪曾派秘使向他透露:肯尼迪並不想為難蘇聯,但是他很可能控制不了局面。赫魯曉夫的口氣似乎是說,他的退讓,是宅心仁厚地給了後者一個好大的面子。儘管這裡面可能有自我吹噓的成分,但是由此也能看出美國人的策略:他們聲稱自己也不願看到最壞的結果,但是卻無能為力。 隨著一場衝突升級,引發一場核戰爭的一系列事件發生的可能性也在增加。最後,戰爭的可能性變得那麼大,以至於終於有一方決定撤退。不過,戰爭的車輪一旦啟動就不是那麼容易控制的了。出人意料的、意外發生的、可能是偶然的也可能是瘋狂的、超出領導人控制的行動,將為局勢激化直至動用核武器鋪設道路。 麻省理工學院政治科學教授巴里·波森有過這樣精闢的描述:「一般認為,激化要麼屬於合理的政治選擇,因為領導層決定先發制人或要避免在一場常規衝突中敗下陣來;要麼就是一個事故,可能是機械故障、越權指揮或陷入瘋狂。不過,從緊張的常規衝突的一般做法產生的激化並不屬於上述兩種類型:它既不是一個刻意的政策措施,也不是一個事故。可被稱為『意外激化』的事情,其實更接近於要打一場常規戰爭的決策之外的一個完全沒有料到的後果。」 核阻嚇包含一個基本的得失結果。有能力發出同歸於盡的威脅,本身就存在一種價值。畢竟,在人類進入核時代之後,我們享受了半個世紀沒有爆發世界大戰的和平。不過,把我們的命運交給概率去控制是要付出代價的。核阻嚇要求我們接受某種同歸於盡的風險。關於核阻嚇的爭論大部分集中在這種風險上。我們有什麼辦法可以降低爆發核戰爭的可能性,同時又不會削弱核阻嚇的力量呢? 訣竅同樣在於確保這樣的普遍化的風險控制在有效的與可接受的界限內。我們已就怎樣做到這一點給出了一些提示,不過,完全成功的邊緣政策仍是一門藝術和一種冒險。 啟示:從古至今,禿鷹就很喜歡戰爭,而且這種戰爭經常發生在同類之間。不知道它們為什麼那麼喜歡戰爭,它們也從來不過多地解釋這些,只會互相攻訐,極力地主張自己的正當性,聲明作惡的都是對方,戰爭就是這樣發生的。禿鷹雖然長著一張可怕的臉,但受傷還是會流血,悲傷的時候還是會流淚。那麼為什麼禿鷹還是要交戰呢?血和淚水究竟還要流多久?我們詢問禿鷹時,也在詢問人類。 逃離邊緣 麻省理工學院政治科學教授波森認為,美國海軍在大西洋的政策很危險,也很容易使局勢激化。一旦與蘇聯方面發生任何常規衝突,美國海軍就想擊沉蘇聯在大西洋的全部潛艇。這一策略的問題在於,目前美國尚不能分辨出核潛艇與常規潛艇。因此存在一個風險,即美國可能由於意外擊沉蘇聯一艘載有核武器的潛艇而在毫不知情的前提下越過了核阻嚇的藩籬。到了這個時候,蘇聯一定覺得自己有理由向美國的核武器發動攻擊,全面核戰爭一觸即發,要不了多久雙方就會開始互投核武器了。 海軍部長約翰·萊曼為這個策略辯護,其說法就跟波森反對這個策略一樣尖銳有力。他認識到一場常規戰爭可能升級為一場核戰爭。但他爭辯說蘇聯也會認識到這一點!局勢激化的可能性不斷增加是合理的,因為這可以首先降低爆發一場常規戰爭的可能性。 一個比喻也許有助於說明問題。假設我們打算降低手槍的精確度,從而使決鬥變得安全一點。可能出現的結果是決鬥雙方開槍前可能會走得更近。假設決鬥雙方都有同樣的好槍法,那麼,決鬥雙方的最優策略是不斷接近對方,在擊中對方的可能性達到1/2的時候開槍。一槍致命的可能性與手槍的精確度無關。可見,改變規則不會改變結果,因為所有參與者都會調整自己的策略,設法抵消這一變化帶來的影響。 要想阻止蘇聯人發動一場常規進攻,美國必須設法使他們面臨這一進攻將會激化為核戰爭的風險。如果這一風險沿著某個方向變得越來越大,那麼,蘇聯人在這個方向的前進就會變得越來越慢。美國(和蘇聯一樣)也就更有可能提出和解,因為它們都清楚雙方正面臨越來越大的風險。 美國和蘇聯在評估自己的策略時,必須以策略的結果而不是行動為依據。另一個有助於思考這一問題的方法是,假設雙方參加前面我們說過的那場拍賣,只不過拍賣用的不是美元,而是發生滅頂之災的概率。到了某一時刻,出價的數字變得越來越高。一方決定就此罷休,而不是進一步使局勢激化最終走向同歸於盡的結局。不過,這一方也可能晚了一步,導致會給雙方帶來損失的概率變成了真實的惡果。 在美國和蘇聯的衝突中,出價就是這個衝突激化的概率。雙方出價的時候怎麼溝通取決於這個博弈的規則。不過,單純改變這些規則並不能使邊緣政策變成一個更加安全的博弈。假如美國改變它的政策,蘇聯也會改變它的策略,並使它對美國的壓力保持在同一水平。在一個更加安全的世界裡,各國可以採取更加容易使局勢激化的措施。只要威脅是一個概率,蘇聯總是可以調整自己的行動,使這個概率保持不變。 這一結論並不意味著你應該就此放棄,聽任可能爆發核戰爭的風險的存在。要想降低這個風險,你不得不從一個更加根本性的層次著手解決這個問題:必須改變這個博弈。哪怕當年的貴族改用精確度較低的手槍,也不能保證他們多活幾年。相反,他們不得不修改扔下一隻手套就決鬥的榮譽守則。假如美國和蘇聯抱有同樣的目的,那就修改這個博弈,而不是單單修改這個博弈的法則。 還有最後一個方面的控制,是使邊緣政策發揮效力所不可缺少的因素。受到威脅的一方通過同意邊緣政策者的條件,必須有能力充分減小這一風險,通常是一路減小為零。偵探必須得到保證,只要歹徒知道那個秘密,他的命就可以保住,而赫魯曉夫也必須得到確認,只要他一退讓,美軍就會馬上撤退。否則,如果無論你做或不做,你都會遭到懲罰,也就不存在什麼退讓的激勵了。 啟示:無論怎樣運用邊緣政策,總有一種跌落邊緣的風險。雖然策略論回顧古巴導彈危機的時候會把它當做邊緣政策的一個成功應用,但假如超級大國之間爆發一場戰爭的風險變成現實,我們對這一案例的評價就會完全不同。若是真的爆發了戰爭,倖存者一定會責怪肯尼迪完全沒有考慮後果,毫無必要地就把一場危機升級為一場災難。第7章 信息與不確定性未來的不確定性源於信息,以及處理信息能力的缺乏。對個人來說,擁有信息越多,越有可能作出正確決策。對社會來說,信息越透明,越有助於降低人們的交易成本,提高社會效率。 無法避免的不確定性 如果有一顆料事如神的水晶球,作決策就不再是一件難事了:不但可以逢賭必贏,還可以把贏來的錢再做無風險且高利潤的投資;擁有完美的另一半,還能在完美的環境里成功培育出完美的子女;更棒的是,絕不會搭乘可能出事的飛機或汽車。如此一來,不但生活有保障,更能活得充實又美妙。可惜,實際上我們無法掌握所有變因,更無力預測未來,甚至連自己將來想要什麼都不知道,所以使得作決策變得困難重重;更別說多人決策、各持己見的狀況了。 不管是對未來、過去、生命的意義,抑或是內心的渴望,只要是我們不知道的部分,都稱之為「不確定性」。不確定性就像死亡、繳稅這等事一樣,是無法避免的。一般人提到不確定性就會聯想到遲緩、笨拙、優柔寡斷這一點可能就是不確定性本身所造成的,以及懦弱等等字眼,但是這麼多的辭彙,說穿了只是表示「我們有所不知」罷了。不過,話說回來,有些事例如某人的電話號碼可以很容易找到答案,但有些事就像「未來」一樣,本來就是不可知,所以不必因為不知道而覺得丟臉。因此,不管別人知不知道,只要有你不知道的事情存在,就有可能陷入不確定的情境之中。如果有人宣稱他無所不知,這種人你最好對他敬而遠之。本章的目的是要探討如何在不確定的情況下作出理性、一致的決策,換句話說,首先必須承認自己雖然沒辦法做到無所不知,但也不至於一無所知,而且應該或儘可能有效運用自己所知的一切。 如果讓我們選出最好看的古典小說,可能很多人都會說:《三國演義》。的確,《三國演義》不但故事精彩,人物鮮活,而且是一部記載著許多博弈案例的著作。 《三國演義》中到處都充滿著「計」,什麼是「計」?也就是策略;用計,即用策略贏對方。 現在讓我們看《三國演義》中一個著名的「空城計」:街亭失守,司馬懿引大軍蜂擁而來。當時孔明身邊只有一班文官,5000軍士已分一半運糧草去了,只剩2500軍士在城中。眾官聽得這個消息,盡皆失色。孔明登城望之,果然塵土衝天,魏兵分兩路殺來。孔明傳令眾將旌旗盡皆藏匿,打開城門,每一門用20軍士,扮作百姓,洒掃街道。而孔明羽扇綸巾,引二小童攜琴一張,於城上敵樓前憑欄而坐,焚香操琴。司馬懿自馬上遠遠望之,見諸葛亮神態自若,頓時心生疑忌,猶豫再三,難下決斷。又接到遠山中可能埋伏敵軍的情報,於是叫後軍作前軍,前軍作後軍,急速退去。司馬懿之子司馬昭問:「莫非諸葛亮無軍,故作此態,父親何故便退兵?」司馬懿說:「亮平生謹慎,不曾弄險。今大開城門,必有埋伏。我兵若進,中其計也。」 孔明見魏軍退去,撫掌而笑。眾官無不駭然。諸葛亮說,司馬懿「料吾生平謹慎,必不弄險;見如此模樣,疑有伏兵,所以退去。吾非行險,蓋因不得已而用之,若棄城而去,必為之所擒」。這就是為後人廣為傳誦的空城計。 當然,「空城計」不過是小說家言,就如博弈論中的遊戲一樣,未必會在現實中出現。但是作為一個博弈模型,這個故事還是很有啟發性的。 在「空城計」博弈中,司馬懿兵多將廣,幾乎所有「好牌」都抓在手裡,而諸葛亮的「好牌」只有一張:那就是「信息」。問題的關鍵在於:司馬懿不知道自己和對方在不同行動策略下的支付,而諸葛亮是知道的,他們對博弈結構的了解是不對稱的。諸葛亮擁有比司馬懿更多的信息,他知道自己兵力微薄,但是司馬懿並不知道。而且,為了讓司馬懿無從了解、判斷,諸葛亮還偃旗息鼓,大開城門,打起了心理戰。因此這是一個信息不對稱的博弈。在這裡,孔明可以選擇的策略是,「棄城」或「守城」。無論是「棄」還是「守」,只要司馬懿明確知道他自己的支付,那麼孔明均要被其所擒。孔明惟一的辦法就是不讓司馬懿知道他自己的策略結果。他的空城計是降低司馬懿進攻的可能收益,使得司馬懿認為,後退比進攻要好。 在信息不充分的情況下,博弈參與者不是使自己的支付或效用最大,而是使自己的「期望支付或效用」最大。比如:如果讓你在「有50%的可能獲得l00元」與在「有10%的可能獲得200元」兩者之間進行選擇,你當然選前者,因為前者的「期望所得」為:50%×100元=50元,而後者為:10%×200元=20元。理性的人是選擇前者的。 在「空城計」博弈中,孔明了解雙方的局勢,製造空城假象的目的就是讓司馬懿感到進攻有較大的失敗的可能。如果我們用概率論的術語來說,諸葛亮的做法是加大司馬懿對進攻失敗的主觀概率。此時,在司馬懿看來,進攻失敗的可能性較大,而退兵的期望效用大於進攻的期望效用,即:司馬懿認為進攻的期望效用低於退兵的效用。諸葛亮惟有通過這個辦法,才能讓司馬懿退兵。 司馬懿想,諸葛亮一生謹慎,不做險事,只有設定埋伏才可能如此鎮定自若,焚香操琴。此時,司馬懿覺得「退」比「進攻」更合理,或者說期望效用更大。於是後軍變前軍,前軍變後軍,後退而去。結果是諸葛亮得以逃脫。 司馬懿對局勢的判斷不是沒有道理的,他對諸葛亮的判斷是基於以前的認識,這就是歸納法。歸納法是人們認識和總結客觀事物規律的一種方法。 嚴格來說,歸納法不很科學,例如,過去人們通過觀察,得出「所有哺乳動物都是胎生的」這個結論,可是後來發現了鴨嘴獸,這個理論就破產了。所以一位哲人曾說:我們並不知道明天太陽還會不會升起。司馬懿因為孔明「生平謹慎」,就料定他「不肯弄險」,也是一例。 但是同樣不可否認,歸納法很有效,我們的所有生活經驗,其實都是「歸納法」,經驗當然不可能代替知識,但是沒有經驗幫忙,我們是很難活得下去的。 司馬懿錯失了活捉孔明的機會,固然是個遺憾,但並不是致命錯誤。作為優勢一方,他知道自己可以通過曠日持久的消耗戰拖垮對方,而後來他也正是這麼做的。相反,如果他真的在局面不明的情況下冒險,中了對方的埋伏,這才是真正的致命錯誤。從這個意義上說,退兵不但不是錯誤,反而可能是司馬懿的「優勢策略」。 啟示1:有一次,主人派伊索進城。半路上,他遇見一位法官。法官嚴厲地盤問他:「你要去哪兒?」「不知道。」伊索回答說。法官起了疑心,派人把伊索關進了監獄,嚴加審問。「法官先生,要知道,我講的全是實話。」伊索說,「我確實不知道會進監獄。」 啟示2:博弈論還有一個譯名就是「對策論」,我們也可以說是「計論」。用計算敵,不僅要自己選擇恰當的計策,而且要算準對方用什麼計策,這不就是博弈嗎? 啟示3:歸納法是一種推理方法,即由一系列具體的事實概括出一般原理(跟「演繹」相對)。簡單說來,歸納法就是通過個別了解一般。例如,在人們發現天體運行規律之前,是通過「太陽每天東升西落」這個現象,知道「太陽不會從西邊出來」這個道理的。 掌握信息,破解難局 我們已經說過,「空城計」只是虛構的故事,不太可能在現實里發生。你可能會想:如果換了我,儘管可能沒有司馬懿那麼聰明,可還是能夠活捉孔明。 我們可以設想,其實司馬懿完全可以派出一個小分隊搞火力偵察,探明虛實再作決斷。這樣即使孔明真的設下了埋伏,他的損失也不大;如果沒有埋伏,就可以進攻活捉孔明。姑且把中計的概率看成1/2,在一個對等賭局中,所得大於所失,這個風險是值得冒的。 成語「黔驢技窮」說的也是這個道理。老虎沒見過驢這個「龐然大物」(其實毛驢並不比老虎大多少),換句話說,就是不知道對抗下的「支付」,開始有點怕這個傢伙。可是長期共處,又不得不明確雙方的地位,於是就進行試探,每次進一小步,直到摸到對方底牌「技止此耳」,老虎就吃掉了毛驢。這就是一個逐漸掌握信息,並在此基礎上作出判斷的過程。 《孫子兵法》說:「兵者,詭道也。故能而示之不能,用而示之不用,近而示之遠,遠而示之近,利而誘之,亂而取之,實而備之,強而避之,怒而撓之,卑而驕之,佚而勞之,親而離之。攻其無備,出其不意。」 大意是說:用兵打仗,離不開運用詭計。要讓對方錯誤估計我方的實力,錯誤判斷局勢。用利益誘惑敵人,用擾亂削弱敵人;敵人有實力,我方要作好準備;敵人過於強大,我要避免作戰;在作戰中要使其激怒,使其驕傲,使其疲憊,使其分裂,這些都能削弱對方的判斷力和戰鬥力。這樣,我方的行動才能出乎對方意料,打擊對方的薄弱之處。 顯然,要實現「攻其無備,出其不意」的目的,一方面要掌握對方的真實信息,同時要防止對方掌握我方的真實信息。 啟示:美軍攻陷巴格達就是採用了這一戰術。薩達姆的共和國衛隊已經潰不成軍,無法組織有效防禦,可以說也是一個不得已的「空城計」。美軍也不知道這裡面有什麼文章,於是就連續派出坦克分隊試探進攻,幾次以後,發現對方確實無力抵抗,於是將巴格達一舉佔領。 「虛張聲勢」 在橋牌中,「叫約」是實力的體現,你有多大的牌,就可以叫多大的約。但這又帶來一個問題:你的叫牌會給對手提供你這手牌的情報,比如你叫梅花三,對方就知道你的梅花很多,至少是個七張套,而且其中有大牌點。其反面的意思就是:你其他的牌可能不怎麼樣。如果他的牌也不錯,就可能叫更高的約,佔據主動打擊你的弱點。由此可見,打牌其實從叫牌就開始了。雙方都要通過叫牌爭取定約,同時要儘可能地迷惑對手,使之錯誤判斷。 我們已經知道,「博弈論」是由著名數學家諾曼創立的,而這個理論正是由一個典型的關於信息的遊戲開始:那就是一個玩家在面對無懈可擊的玩牌對手之時,是否要誇大其辭,並且次數又該多頻繁。 諾曼的發現非常令人感到意外,他認為即使對手明知道你喜歡這樣,有時候你還是應該這樣。他研究了各類的牌戲戰術,發現「虛張」的頻率一到某個程度,勝數最多,打老實牌和「虛張」次數太多的勝數機會較少。另外他也發現,玩牌虛張的頻率在某種標準可以贏錢,低於或高於某個標準,輸錢的成分就比較大。 這不難理解,一個人如果適當地「吹牛」,別人就會信以為真,如果他玩得過了火,人們就會識破,而且,一旦獲得了「吹牛者」的名聲,那麼他就成了那個大叫「狼來了」的孩子,再說什麼也沒用了。那麼什麼是「適度」呢?自然是不能過分誇張,如果一個小個子非要給人留下「鬥士」的印象,結果只能是自取其辱。 虛張聲勢歸根結底就是要藏好自己的底牌,並因此獲得利益。這有兩種情況:一是還有一定實力,通過迷惑對手,使之出現破綻,一擊致命;二是沒有什麼實力,只靠大張旗鼓換取對方讓步。總之,你要知道自己的目標,一切策略都是為此服務的。 還要注意:「虛張」也是雙刃劍,弄得不好反會弄巧成拙。比如出虛張迷惑對手,卻使同伴被誤導。在生活中也是如此,吹牛使詐,是為了獲得人們的擁戴,可是做過了頭,反會使人反感,無端樹敵。所以古人說:詐巧不如拙誠。這類手段不得不用,但是也不可常用。 關於信息博弈的故事會 一個古董商發現一個人用珍貴的茶碟做貓食碗,於是假裝對這隻貓十分喜愛,要從主人手裡買下。貓主人不賣,為此古董商出了大價錢。成交之後,古董商裝做不在意地說:「這個碟子它已經用慣了,就一塊送給我吧。」貓主人不幹了:「你知道用這個碟子,我已經賣出多少只貓了?」 這就是一個「信息博弈」的例子。古董商掌握「碟子是古董」這個信息,他認為貓主人不知道,這種「信息不對稱」對他有利;可他萬萬沒想到,貓主人不但知道,而且利用了他「認為對方不知道」的錯誤大賺了一筆。這才是真正的「信息不對稱」。 信息不對稱造成的劣勢,幾乎是每個人都要面臨的困境。誰都不是全知全覺,那麼怎麼辦? 首先,為了避免這樣的困境,我們應該在行動之前,儘可能掌握有關信息。人類的知識、經驗等,都是這樣的「信息庫」。當然,我們並不一定知道未來將會面對什麼問題,但是你掌握的信息越多,正確決策的可能就越大。 再來看一個故事:有一個賣草帽的人,有一天,他叫賣歸來,到路邊的一棵大樹旁打起瞌睡。等他醒來的時候,發現身邊的帽子都不見了。抬頭一看,樹上有很多猴子,而且每一個猴子的頭上都有頂草帽。他想到猴子喜歡模仿人的動作,於是就把自己頭上的帽子拿下來,扔到地上;猴子也學著他,將帽子紛紛扔到地上。於是賣帽子的人撿起地上的帽子,回家去了。後來,他將此事告訴了他兒子和孫子。很多年之後,他的孫子繼承了賣帽子的家業。有一天,他也在大樹旁睡著了,而帽子也同樣被猴子拿走了。孫子想到爺爺告訴自己的辦法,他拿下帽子扔到地上。可是猴子非但沒照著做,還把他扔下的帽子也撿走了,臨走時還說:我爺爺早告訴我了,你這個老騙子會玩什麼把戲。 有些信息可以在決策之前掌握,還有一些信息出現在決策的過程中,這就需要某些特殊素質了,比較聰明、敏銳的人可能在這個環節佔據先機。 一個商人貼出告示,要招一個夥計。來了兩個應徵者,他們同樣勤快,商人決定不下要哪一個,他希望店裡的夥計要精明一些,於是就想了一個主意。 他把兩人叫到裡面,取出五頂帽子,兩頂紅的,三頂黑的,他要求他們蒙上眼睛後,三個人各取了一頂帽子戴上,他告訴他們:摘下眼罩後,誰先說出自己帽子的顏色,他就留下誰。 眼罩摘下,這兩個人發現商人戴著一頂紅帽子,兩個人互相看了一眼,其中一個搶先說:「我的帽子是黑的。」 商人很滿意,問他怎麼知道的,他說:「你戴著一頂紅的,如果我的也是紅的,他一定知道自己是黑的,可他沒有說,所以我知道,自己戴的也是黑色的。」 這是一個在決策中掌握信息並作出判斷的例子,頗有博弈色彩。其實是對手的反應幫了他的忙。如果對手很聰明,就可能採取以下戰術:不肯摘下眼罩,或根本不看對方,這麼做似乎吃虧,其實正好相反。因為如果自己戴的是紅帽子,無論知不知道對方帽子的顏色,他都會輸;可是對方如果不能做出判斷,那他就可以判斷出自己戴的是黑帽子。 還有許多情況是,我們根本不能從他人或外界得到有用的信息,那麼該怎麼辦呢? 有一個很著名的BF實驗(所謂BF就是Bee和Fly,即蜜蜂和蒼蠅):把幾隻蜜蜂和幾隻蒼蠅裝進一個玻璃瓶中,然後將瓶子平放,讓瓶底朝向窗戶,結果會怎樣呢?你會看到,蜜蜂會不停地在瓶子底部尋找出口,直到累死為止,而蒼蠅卻在不到兩分鐘內全部逃出。蜜蜂為什麼會滅亡呢?因為蜜蜂喜歡光亮而且有智力,於是它們堅定地認為,出口一定是在光線最亮的地方,於是它們不停地重複這一合乎邏輯的行動。而蒼蠅呢?它們對於事物的邏輯並不在意,而是到處亂飛,探索任何可能出現的機會,於是它們成功了。 這件事說明,實驗、試錯、冒險、即興發揮、迂迴前進、混亂、隨機應變,所有這些都有助於應付變化。人的理性和邏輯性容易使人在經濟活動中陷於一個固定的認知模式中,從而一條道跑到底。經濟活動要善於從已有的認知模式中跳出來。要有足夠的學習能力——即探索未知領域的能力。 即使這些方法都不奏效,你至少還可以權衡利弊,作出合乎理性的決策——你仍有可能犯錯,但不至於錯得一塌糊塗。就如司馬懿在「空城計」中的選擇那樣,放走了孔明固然遺憾,但是總比自己做了俘虜要好。 啟示:在生活中,我們也會遇到這樣的問題。比如一個乞丐向你乞討,你願意幫助別人,但你不知道他是真的需要幫助還是騙子,該如何決定呢?如果你喜歡與人為善,你可能就願意冒一點上當的風險。這不等於你愚蠢,而是你認為,幫助一個困境中的人比回絕一個騙子更重要。 所羅門王斷案 在社會經濟活動中,人們常常隱蔽真實的信息。最典型的例子,是在市場里老是聽到買東西的人埋怨東西太貴,較少聽到買東西的人稱讚東西便宜。同時,廠商又老是埋怨東西賣不出好價錢。在經濟學家看來,對價錢的抱怨是自相矛盾的。如果嫌貴,你可以不買;如果嫌賤,你可以不賣。因為在市場上,人們不是用言詞,而是用行動表示出他們的愛好。如果你自願地同意做一筆交易,這說明你認為,雖說不是很理想,但是做這筆交易至少比不做這筆交易要好。雖然兩塊錢買一把菜你嫌貴,但是你還是認為用你那兩塊錢換回這一把菜是值得的,不然的話你可以不買,因為沒有人強迫你。 至於談判當中隱蔽自己的真實信息,常常還受到法律保護,不然怎麼會有泄露經濟情報罪和盜竊經濟情報罪呢? 提取和甄別信息,是博弈論面對的大問題。引用很多的一個例子,是所羅門王斷案的故事。兩個女人為爭奪一個孩子吵到所羅門王那裡。一個女人說:「陛下,我和這婦人同住一個房間。我生了一個孩子,三天以後這婦人也生了一個孩子,房間里再沒有別的人。夜裡這婦人睡覺的時候,把自己的孩子壓死了。她半夜醒來,趁我睡著,把我的孩子抱去,把她已經死了的孩子放在我的懷裡。天亮要餵奶的時候,我才發現懷裡的孩子是死的,仔細察看,並不是我生的孩子。」另一個女人趕緊說:「不對,活孩子是我的,死孩子才是她的。」吵得不可開交。 所羅門王喝令她們別吵,吩咐下人拿刀來,「如果她們還吵,就把孩子劈成兩半,一半給這個婦人,一半給那個婦人」。一個女人趕緊說:「大王把孩子給那個婦人算了,萬不可殺他。」另一個女人說:「這孩子既不歸我,也不歸她,劈了算了。」所羅門王知道心痛孩子的女人一定是孩子的親生母親,便吩咐下人把孩子給她。 這是獲取和甄別信息的範例,直到現在,博弈論專家還在繼續討論和發掘所羅門王斷案的故事。例如,以色列一位教授和美國一位教授最近合寫的一篇論文,就把競標一項工程的兩個企業,看做是兩個「婦人」,其中一個企業實力可靠,另一個企業只是想奪標以後賺取轉包的利益。問題是如何設計規則和機制來獲取和甄別信息。 破解「檸檬市場」 在美國的俚語中,「檸檬」是「次品」或者「不中用產品」的意思。20世紀60年代,經濟學家阿克洛夫正是從舊車市場這一他眼中典型的「檸檬市場」分析和提煉出「信息不對稱」的概念。 中國有「買的不如賣的精」的古訓,足見中國人老早就洞悉了信息經濟學的天機。可惜,沒有一個中國人接著往下想這意味著什麼,尤其是對於市場經濟來說意味著什麼。 阿克洛夫則不同,他把這問題繼續往深里琢磨。這一琢磨不得了,他發現問題大了:由於買主賣主對於所要交易的「舊車」存在著信息不對稱,買主通常不願出高價,這樣持有好車的賣主只好選擇退出,市場上剩下的將都是壞車,買主則越來越不願光顧,舊車市場最終將萎縮乃至完蛋。阿克洛夫的這一發現尤其是他提出的「信息不對稱」的概念後來影響了一大批經濟學家,大家又相繼發現了許多個「檸檬市場」。比如,經濟學家斯賓斯發現人才市場其實也是個「檸檬市場」:由於信息不對稱,僱主願意開出的是較低的工資,除了平庸的「檸檬」之外根本不能滿足精英人才的需要,結果出現了劣幣驅逐良幣的現象。斯蒂格利茨發現信貸市場也是個「檸檬市場」:因為信息不對稱,貸款人只好確定一個較高的利率,結果好的本份的企業退避三舍,而壞的壓根就不想還貸的企業卻像蒼蠅逐臭一樣蜂擁而至。這兩位教授因此同阿克洛夫一同分享了諾貝爾經濟學獎。 經濟學家提煉出信息不對稱的概念,挖出一批「檸檬市場」並解剖之是一大貢獻;而提出改造世界的方案,設計出各種在信息不對稱情況下保障市場有效運轉的機制是另一大貢獻,甚至可以認為是更大的貢獻。 對於拍賣市場,我們通常想到的是,誰出價高交易物即給誰。可是你是否想到,拍賣人可能說「假話」。好比我本來願意出10000元的,但只要第二名出8000元,我出8001元就能拿下來的話,我就不會報價10000元。如何讓競買者顯示出真實的信息呢?維克瑞教授小試牛刀,運用信息經濟學原理設計了一個新的拍賣機制。 讓每個人把願意出的價格寫在紙上裝入信封交給你,所有信封打開後,出價最高的人得到那件古董,但實際付的價格是第二位出價最高者的出價。在這個制度下,每個人都會如實地報告自己對古董的評價,因為出價多少隻影響自己是否得到古董,而不影響在得到古董的情況下付多少錢。 比如說,設想有一個人的實際評價是10000元,如果他出價10000元,第二個最高出價是9900元,他得到100元的凈剩餘;相反,如果他出價9800元,他的凈剩餘是零,因為他什麼也得不到。在維克瑞教授設計的機制下,說實話比不說實話好。這裡,真實評價與實際支付的價格之間的差額變成了對說實話的獎勵。 這樣的拍賣機制不僅可以保證把被拍賣物賣給評價最高的人因而是最有效率的,同時也是在所有拍賣機制中賣者能得到最高收入的拍賣機制,這真是經濟學夢寐以求的帕累托改進,是一種難得的皆大歡喜的制度安排。 啟示:兩隻手錶並不能告訴你更準確的時間,只會讓你在兩種不同的時間面前茫然無措。你要做的就是選擇其中較可信賴的一隻,儘力校準它,並以此作為你的標準,聽從它的指導行事。記住尼採的話:如果你想過得幸運一些,你必須只採用一種判斷準則而不要貪多,這樣你會活得更容易些。 「信用印章」 儘管我們可能在交易或博弈的過程中學習新的知識,但是如果只能這樣「經一事,長一智」,那麼交易的風險成本就太高了。一個缺乏互信的社會,任何事業的發展都是困難重重的。那麼,能否通過某種制度安排,降低「信息不對稱」的成本呢? 現在,「誠信」已經成為人們經常談論的一個詞,大家公認,信任的缺乏已經成了一個困擾中國市場經濟發展的大問題。 為什麼人們普遍認為「信任」與「被信任」很難呢?在此我們不必彈什麼「人心不古」的老調,關鍵問題不是人的道德水平,而是制度安排。現在中國的市場經濟剛剛起步,制度上有許多不完善之處,一些混亂難以避免。問題是如何儘快建立一套信用機制,規範人們的各種商業行為。 近代歐洲最偉大的思想家之一韋伯曾談到過這樣一件事:在他到美國北卡羅萊納州訪問期間,恰巧遇到位男子正在接受基督教的洗禮。有人告訴韋伯,這個人之所以要接受洗禮,是因為出於商業動機,他想在這個社區開銀行。一旦接受了洗禮,他就會得到整個社區所有人的信任,而不論這些人是否真是基督徒。 韋伯進一步發現,想成為一個本地基督教會的成員,要經過非常嚴格的考察,要接受極為嚴密和細緻的對自己過去行為的調查。因此,加入教會就會成為他道德水準的一個絕對保證。也就是說,一旦被洗禮了。此人的道德品質特別是與經商有關的品質,是經得起考驗的,是完全可以信得過的。此人即使轉移到其他地方,只要有教會的證明,就擁有了自身誠信的證明,無論走到哪裡,人們都會相信你。 韋伯認為,加入一個社會團體就等於獲得了一個社會印章。這枚印章是制度化的「印信」。它是以利益、合作、信用為基礎的。應該說,一個人取得這枚印章是要付出足夠努力的。而一旦有了這枚印章,就可以獲得很多相關的利益。 這個例子告訴我們,一套有效的信用機制,可以大大降低人們的商業風險和成本,對社會、個人都大有好處。 信息就是權力 大家知道,知情權是人們重要的社會權利之一,即人民發布和接受信息的權利得到尊重和保護(當然要在法律的規範內)。為什麼知情權如此重要?就是因為信息的傳播有利於人們在掌握信息之後,通過理性選擇,作出正確決定。這對社會和個人都有好處。 培根曾說:知識就是力量。的確如此,因此我們也可以說:信息就是權力。在專制時代,統治者維護自身權力的一個重要手段就是壟斷信息。孔子說:民可使由之,不可使知之。大意是:你要引導人民該怎麼做,但不要讓他們知道為什麼該這麼做。 民眾的知情權不是什麼人賜予的,而是爭取來的。不管怎樣,現在我們接受信息的渠道更多了,信息也更多了。 可同樣是現在,我們太輕易地放棄了這個來之不易的權利。我們一股腦接受來自各方面的片面信息,我們對事物的態度取決於電視上怎麼說,至於它說的對不對,有什麼根據,我們並不知道,或不感興趣,「快告訴我誰是好人,誰是壞人。」我們就像孩子那樣要求一個簡單快捷的答案。 勒龐《烏合之眾》中說:結論越是專斷,語氣越是肯定,對公眾的影響力越大。因為公眾不善推理,卻很易受感染。他說:「群體因為誇大自己的感情因此他只會被極端的感情打動。希望感動群體的演說家,必須出言不遜,信誓旦旦。」根據他的觀察,誇大其辭、言之鑿鑿、不斷重複、絕對不以說理的方式證明任何事情,是說服群眾的不二法門。他甚至尖銳地指出:「群眾從來就沒有渴望過真理,面對那些不合口味的證據,他們會充耳不聞……凡是能向他們提供幻覺的,都可以很容易地成為他們的主人;凡是讓他們幻滅的,都會成為他們的犧牲品。」 對各種信息,我們需要選擇:「拿來」還是「接受」?不同在於:「拿來」的才是你的,而「接受」的不是。即使是好東西,也不會為你所有。信邪教的官員、學者、大學生,他們的知識、信仰為什麼不能保護他?就因為這些東西是別人「塞」給他的,他也習慣了被塞,既然你能塞給他知識,別人也能塞給他邪說。 啟示:在渴望理想的心靈里,科學是有所欠缺的,因為它不敢作出過於慷慨的承諾,因為它不能撒謊。 要不要相信權威 當你無所適從時,你希望得到正確的指導。從人生設計、該不該和那個女孩結婚到填寫足球彩票,都是如此。關於專家,有一句俏皮話:所謂專家,就是周旋於三宮六院間的太監,無所不知,卻無能為力。大意是說專家的理論可以解釋一切,卻沒有多少實用價值。 權威也會犯錯,但是還是對的時候多(否則他就不是權威了)。權威因為擁有更多信息、更強的處理信息的能力,所以他們的意見可能比普通人更有價值。但是並不一定正確,因為即使權威也不可能全知全覺。這裡有一個概率問題:好比某人獲勝的概率較大,並不等於勝利已經屬於他。 權威只是某一方面的,一旦超出了他所擅長的範圍,他的意見並不一定比別人高明,可是我們時常忘了這一點。好多大人物就是因為在自己並不擅長的領域輕率發言而蒙受羞辱。「大躍進」時代,一位權威科學家撰文證明「畝產萬斤」是完全可能的。即使是出於真誠,這位科學家的發言也是極不負責任的,他在自己並不了解的領域發言,可其他人並不知道在這方面,他懂得並不比別人多。 在決定要不要聽專家意見時,你還要弄明白:這個問題有標準答案嗎?如果你問怎樣造一架飛機,一個技術權威會給你最有用的忠告;可是如果你的問題是哪個隊能獲得世界盃,你在專家那裡得到的就只是一個參考意見。上次世界盃,一半專家看好法國隊,可是這個上屆冠軍在小組賽就被淘汰了。 權威不是神,他只是比我們有更多知識或更深的理解。但他也必須依靠足夠的信息、條件來作判斷,如果條件是不充分的,也就可能出錯。即使條件充分,如果我們對事物的理解不充分,他一樣可能犯錯。權威明智嗎?他是否知道自己的限制?這正是自信和武斷的區別所在。 愛因斯坦曾說過一句名言:他不相信上帝在擲色子。他認為在無序運動背後,一定有某種規律。他用後半生尋找這個規律,卻一無所獲。當時很多頂級科學家都很為他惋惜,但都保持了對他的尊敬。因為愛因斯坦是以嚴謹的科學精神進行研究的。試想:如果他利用自己的名望,提出某種大而無當的理論,又會讓多少人迷惑? 啟示:權威:使人信服的力量和威望;在某種範圍里最有威望、地位的人或事物。 懷疑是權利的保證 在一個充滿了輕信的社會(可以想像甚至包括名牌大學的教授)中,如何讓這種批判性思維方法更廣泛更深刻地傳播? 買二手電筒腦時,你當然想相信經銷商說的「價廉物美」,但你會對此持懷疑態度。你必須了解一些電腦方面的知識,可能弄得經銷商對你有意見,這很有點令人不快。除了這些你可能會發現經銷商有隱瞞真相的動機,也曾聽到別人的一些類似情況,因此你檢查一下外觀,打開電腦試著操作一下,問一些刨根問底的問題。你甚至帶一個內行的朋友去。你懂得一定的懷疑是必要的,也知道為什麼。買舊貨時總會有一點不友好的衝突,沒人會宣稱這是一種特別愉快的經歷,如果你不提出一點點懷疑,如果你絕對地無限度地輕信,日後必然付出慘重代價。那時你會希望早些時候要是多些懷疑就好了。 懷疑主義的原則不需要必須用高深的知識水平去掌握。對任何事物持懷疑主義態度的完整的思想是,每個人都應該具備能夠對任何「科學成果」進行有效的和有益的評價所必不可少的工具。完整全面的科學提出的要求是,所有的公民在日常生活中都能運用普遍水平的懷疑主義精神。當我們購買二手電筒腦時,當我們根據電視商業廣告判斷產品的質量時,我們要採取懷疑的態度。 但是,懷疑的工具對我們社會的公民來說,經常普遍喪失其效力。儘管在日常生活中各種令人失望的事情使人們隨即不斷萌發出懷疑主義的精神,但是,在學校中根本就沒有提起過有關內容,甚至科學在展現其成果(最令人失望的表現者)時也沒有這種精神的體現。我們的政治、經濟、宣傳都被淹沒在輕易相信、盲目服從的汪洋大海之中。那些有東西要賣的人、希望影響公眾輿論的人、大權在握的人,將會在阻止懷疑精神的發展中獲得好處。 從前面的討論中,我們已經了解:獲得信息、並正確利用信息,是做出合理決策的保證之一。作為個人,要學會思考;作為社會,要鼓勵(至少是允許)人民思考。這樣才是雙贏。 一個富於創新精神的高中社會科學課教師是這樣讓學生們理解美國憲法的:他不是照本宣科地給學生讀憲法,也不是塞給他們一些「價值」、「意義」、「地位」之類的概念,而是安排了一場「制憲會議」:學生兩人一組代表一個州,參加制憲會議。並事先向這13個小組就他們所代表的州或地區的特殊利益作簡要的指點。比如南卡羅萊那的代表將被告知棉花的重要性,奴隸貿易的必要性和合理性,工業化的北方所造成的威脅,等等諸如此類。 13個代表團聚集在一起,教員給予些指點,但主要是依靠他們自己,經過幾個星期寫下了一部憲法。然後他們讀真正的憲法,並對兩部憲法的相同和不同之處進行討論。這樣做需要教師做更多的準備,學生做更多的工作,但這次經歷是令人難以忘懷的。 試想:如果每個公民都經歷過這樣的訓練,一定有助於加深對政治的理解,並能夠更理性地行使自己的政治權利。 啟示:群獸之王獅子生病了,它傳令它的「臣民」們都應該派遣使者來探病,否則就要給予嚴厲的制裁。動物們雖然都覺得有點不安,卻沒有違抗獅子命令的勇氣,也沒有去確認其他動物在探望之後的下落,輪到自己時都理所當然似的前往探視。狐狸發現了其中的秘密。它來到獅子洞外,很恭敬地問獅子身體如何。獅子說:「我沒什麼事,請進來和我聊一聊吧。」狐狸回答說:「不,我有些害怕,我發現這裡有許多進洞的足跡,卻沒有一個出洞的。」這個故事是說,根據跡象預見到危險的人,能夠避開危險。第8章 約會遊戲擁有信息可以幫助你作出正確決策,但不能保證你作出正確決策。要實現這一點,你必須有合適的策略。 別無選擇與選擇的煩惱 有這樣一個笑話: 夏娃對亞當說:「親愛的,你是全心全意愛我的嗎?」 亞當嘆了口氣:「當然了。除了你,我還能有什麼選擇呢?」 經濟學中有一個名詞「霍布斯的選擇」,據說這個名詞來自中世紀英國一位叫霍布斯的馬場老闆。無論誰來買馬,他都答應,但是每次他只賣最靠近門口的那匹馬,不允許挑三揀四。於是「霍布斯的選擇」其實就是「沒有選擇」的好聽一點的說法。 在商業競爭不發達的社會,「霍布斯的選擇」很多見,比如多年前中國人單調的服裝樣式,或幾年前昂貴的電話初裝費。這種煩惱叫每個人頭疼,又沒什麼辦法,這畢竟不是我們個人所能改變的。 隨著競爭的發展,這種煩惱較過去大大減少了。可是另外的煩惱又找上來:太多的選擇叫人眼花繚亂。當然,這總比沒有選擇要好多了,可是要從諸多選擇中找到最優結果也並非易事。 如果選擇只是限於買什麼樣的衣服,或選擇吃牛肉麵還是麥當勞之類的小問題倒也無關緊要,可是小至人生道路的選擇,企業經營戰略的設定,大至國家的大政方針,都有一個最佳策略的問題。這也正是為什麼人們對此如此關注的原因。如果別無選擇,你也只能這樣走下去,正如亞當只能愛夏娃一樣。這個結果也許並不理想,但至少你知道自己沒做錯什麼。一旦你有了選擇的權利,責任也就隨之而來:如果結果不好,只能說你做得不對。 每個人都希望有選擇,而且希望作出正確選擇——即使不是最好的,至少也是比較好的,那麼有沒有一些方法幫助我們呢? 啟示:不要坐失機會,當時機把有頭髮的頭伸出來而沒有人去抓時,回頭它便會伸出一個禿頭來。——沙士比亞 眾里尋他千百度 現在來看「約會遊戲」:假定你是個女性,決定要結婚,你身邊社交圈裡有100個合適的單身男子都有意追求你,你的任務就是,從他們當中挑選最好的一位作為結婚對象。但要從這100個裡面選出最好的一個並非易事,你該怎麼做才能爭取到這個結果? 首先你想到的是和這100個人都接觸一遍,了解每個人的情況,將各項素質分別打分,說不定還要列出圖表,經過對比篩選,找出那個最優秀的人。 可惜在這個遊戲中,條件是嚴格限定的:每個人你只能約會一次,而且只能當場決定選擇還是放棄,不能把他們「冷凍」起來作為後備,一旦你選擇了其中一個,你就沒有機會再約會別人了。這些條件似乎有點苛刻,其實在生活中,大多數情況下機會是不等人的,等你左挑右選,把一切都規劃好了,人家可能早就成了別人的如意郎君。所以說,這樣限制是有道理的。 要從一籃蘋果當中挑出一顆最好的,一個個比較是最佳法則,因為每一個都可能是最好的,也可能是最差的。所以你得開始約會——還有什麼更好的方式可以用來檢驗這些人嗎?但是約會和選蘋果是不一樣的,挑選蘋果可以把兩顆拿起來比一比,可是正如我們已經說明的,在這個遊戲當中一次只能跟一個候選人約會,每次約會後就必須立刻決定這個人有沒有可能是最好的一個,雖然有很多人你還沒約會過。一旦某位幸運的男士中選,你就不再約會(當然這只是遊戲,現實生活中並不一定如此)。 還有一個遊戲規則必須遵守,約會之後一旦你決定淘汰這個人,他就永遠出局了。你可以假設他娶了別人、或者心灰意冷出家當了和尚、甚至跳下斷崖一死了之。重點就是你不能和每個候選者約會後,再把他們貼上排名的標籤,收藏在倉庫的架子上,最後才從裡面挑最好的一個,也就是你不可以把所有的候選人當貨物一般存起來。統計學家稱這種一邊搜集資料一邊做決定的決策過程為運次決策。 這類情況在臨床實驗上屢見不鮮,例如給這群病患極有潛力的新葯,給另外一群病患無傷害性也無治療效果的安慰劑。實驗人員必須隨時在發現藥物有效時立即提供給對照組;當藥物出現傷害時,立刻讓實驗組停止服藥。一有結果實驗就必須立刻停止。同樣地,除非約會的快樂對你而言高過對婚姻的憧憬(那可就另當別論了),否則你也必須停止不斷的約會。 問題其實很簡單,你希望選到最佳伴侶,但是又該如何在既定的規則下,將找到理想對象的幾率極大化呢?如果太早結束約會生涯,就等於放棄了在那群還沒約會的對象中,找到一個比現在更好伴侶的機會,倉促的婚姻將使你終生悔恨。匆匆結婚後的漫長悔恨,這種事在現實生活中並不少見。不過,話說回來,如果你等得太久,最好的那個又可能已經從指間溜走,要補救也來不及了,這種事在現實生活中也是經常發生的。這兩種悲劇都是歌曲、詩詞和小說常見的主題。 啟示:兩個貧苦的樵夫在山上發現了兩大包棉花,兩人各背了一包趕路回家。途中,一名樵夫看到山路上有一大捆上等麻布,便和同伴商量,改背麻布回家,同伴怕枉費辛勞,不願換麻布。發現麻布的樵夫只得一個人背麻布了。走著走著,背麻布的樵夫竟然發現林中散落著數罐黃金,便趕忙邀同伴來挑黃金。他的同伴仍是那套以免枉費辛苦的論調,並且懷疑那些黃金不是真的,發現黃金的樵夫只好自己挑了。快到山下時,天無緣無故地下了一場大雨,背棉花的樵夫肩上的大包棉花吸飽了雨水,重得無法再背,那樵夫只好空著手和挑金的同伴回家去。面對機會的來臨,人們有許多不同的選擇方式,每次正確無誤的選擇都將指引你走在通往成功的坦途上。 別選第一個碰到的人 那麼到底什麼是贏的策略呢?贏的策略就是能夠給你最大成功機會的策略。縱使無法100%肯定,但是你知道自己要的就是最大的成功機會。那麼這個遊戲就變得很簡單了,因為你知道你要的是什麼,一切透明化,只要靠自己就可以獨立完成命運攸關的決定,也就是把選擇的過程最適化即可。 說了這麼多,到底最好的選擇方式存不存在呢? 當然是存在。雖然這種方式不能給你最肯定的答案,但是絕對可以增加達成目標的機會,這和買彩票不一樣,無論你花費多少心思買彩票,結果都取決於運氣。而在這個遊戲中,只要你策略對頭,就能取得不錯的成果。現在就來場沙盤推演吧。 顯然,你不應該選擇第一個遇到的人,因為他在100個當中名列第一的機會只有1%。這個幾率可以說是非常的渺茫,直接把籌碼放在第一個人身上,也是最糟的賭注。同樣地,第二個人、第三個人,甚至後面的人,情況都一樣,每個人都只有1%的機會可以成為100個人當中的第一名。如果你真心想要找到最好的,就不應該隨機選擇。 但是這裡有一個問題:假如你約會的頭一個碰巧是最好的那個呢?你把他淘汰掉了,以後約會的對象「一蟹不如一蟹」,豈不是遺恨終生嗎?在我們身邊,確實有些夫妻是初戀情人,而且似乎過得也不錯。但是這裡我們談的是策略,而不是命運或緣分,只要你不是十分迷信,就一定會承認,與其把自己的未來交給或然率,還不如自己掌握更好些。 剛剛說過,你不應該選擇第一個出現的對象,因為第一次約會就碰到最佳伴侶的機會微乎其微,只有1%。即使這個人真的很優秀,你也要忍痛割愛,因為你不知道在這100人里,他到底排在什麼位置。 再次聲明:這只是個遊戲,如果你在現實生活里找對象不必如此。因為在遊戲中,這位女性對這100人原來一無所知,而在生活中,即使沒談過戀愛,你對異性也有很多了解,例如你的父兄、親屬、朋友、同學等等,在很大程度上,你已經知道什麼樣的男人可以交往,什麼樣的不能。也就是說,你心中早已有了一個標準,這和遊戲中假設的不同。所以如果你在現實里遇到一個好男人,你應該把他留下,而且你們只要還沒結婚,「騎馬找馬」也不能算不道德。 犧牲者與實驗品 好了,現在切入正題,討論選擇策略。一個最有效的方法是:將第一組人(比如說先取10名)作為試驗品,就好像在糖果店或麵包店裡的試吃品一樣,之後如果遇到比這組人更好的對象,就可以考慮嫁給他了。這個方法既可以在候選人之間作比較,同時也不會與現實太過脫節。你可以在日記里給每個約會對象評分,以10分為滿分,當分數高於前10人的對象出現時,他就是最後的贏家。你要做的就是從前10個人當中獲取一些經驗,作為評估他人的基礎,所謂約會其實就是這麼一回事。 值得注意的是,運用上述策略時,有兩種情況會使你損失慘重。第一,如果前10名剛好是全部裡面最糟的,碰巧下一個又是倒數第11名,那就算你倒霉了,你將面臨一個相當壞的選擇,雖然不是最壞,不過也夠糟的了,並錯失選擇最好的機會。因為既然這個倒數第11名已經比前10個都要來得好,依照上面的決策模式,選擇他是不會錯的,可是其實首選對象仍在苦苦地等待著你,只不過你還處於約會初期,絕不會知道這點。這就像是成天在一群奇怪的人周圍打轉,和這些人相處的經驗將扭曲你對正常人的印象。 第二種狀況正好相反,就是最好的選擇恰好已經在前10個當中,導致你設了一個永遠無法達到的高標準,在未來的約會中不可能再遇到和他們一樣好的,最後只好在所有機會都出現後選擇第100個。而這第100名頂多只是中等標準。那麼,終其一生,你將幻想著,要不是放棄了那一個人,結果就會如何如何。採行這個策略有大輸、大贏的機會。我們不難解釋在運用此一策略的情況下,你將有1/4贏的機會,也就是與最優秀的人結婚的幾率達25%。這當然比隨機選擇好得多,但還沒有十足的把握。因此,接下來,你得決定排名第l、第3,或第5的次佳選擇。 那麼是不是還有更好的決策呢?當然,在這個案例中,由於你只從100個候選人當中取了10個樣本,而最佳選擇剛好在樣本中的機會只有1/10,因此第二種錯誤(也就是讓最佳選擇從手中溜走)的發生機會相當小。所以,在此類錯誤風險不高的情況下,也許你會願意提高抽樣的數目,這樣就有更多的經驗來增加自己的判斷能力。因此如果運用相同的策略,但是將樣本數改為20,那又會如何?如此一來,雖然最佳選擇從手中溜走的機會將會從1/10增加到1/5,但也會大大降低設立過低標準的可能。這是一種交換條件,如果有一邊更好,另一邊就會更糟。那麼如果抽樣數目是30,甚至40,又會如何? 說了這麼多,你可能已經明白了一點:這是一個兩難選擇,如果你抽取的「樣本」太少,你得出的結論可能並不準確;可是如果你取樣太多,結論倒是準確了,可是又很有可能錯失最佳選擇(他正好在取樣里,被犧牲掉了)。那麼,在這樣的選擇中,有沒有個最佳樣本數的存在?如果有,那麼該是多少? 啟示:有四樣東西一去不復返:說過的話、潑出去的水、虛度的年華和錯過的機會。永遠沒有絕對完美的事,最大的問題在於:你是否能夠對你的冒險衷心說「是」! 哲學大師的訓誡 有趣的是,古希臘哲學大師蘇格拉底也遇到過這樣的問題,而他的答案與現代的策略專家不謀而合。 蘇格拉底的三個弟子曾向老師求教:怎樣才能找到理想的伴侶?蘇格拉底沒有直接回答,而是把他們帶到一塊麥田,要求他們沿著田埂直線前進,不許後退,而且僅給一次機會選摘一枝最大的麥穗。 第一個弟子走幾步看見一枝又大又漂亮的麥穗,高興地摘下了。但是他繼續前進時,發現前面有許多比他摘的那枝大,只得遺憾地走完了全程。第二個弟子吸取了教訓,每當他要摘時,總是提醒自己,後面還有更好的。當他快到終點時才發現,機會全錯過了,只好將就著摘了一個。第三個弟子吸取了前兩位教訓,當他走到1/3時,即分出大、中、小三類,再走1/3時驗證是否正確,等到最後1/3時,他選擇了屬於大類中的一枝美麗的麥穗。雖說,這不一定是最大最美的那一枝,但他滿意地走完了全程——因為他知道,自己已經儘可能爭取到最好的結果了。 注意那個結果最好的弟子的策略:1/3。為什麼這是一個比較理想的比例呢? 事實證明,選擇最佳對象的最好搜尋策略,就是在冷靜地比較若干樣本後,選擇下一個高於他們全體的那一個,稱為約會比率與等待流程。失去最佳選擇的風險約有1/3,但是你已經竭盡所能了,而且你還有大約1/3的機會在100個當中挑中最想要的那一個。其實當你在100個人當中挑選時,1/3的機會已經算是不錯的了(坦白說,1/3其實並不怎麼準確,不過在現實生活的決策里,要精準到小數點以下第6位似乎不太有意義)。所以相同的邏輯也可以套用到選擇上。 明確你的動機 但稍等一下,先回顧那些已經確認的因素。你到底是不是確定你的動機和企圖?你是不是真的一定要從那100個對象中挑出最好的下一個? 但是追求最好選擇也是有缺點的。如果最好的候選人就在你抽取的樣本之中,你就必須嫁給100個裡面最後和你約會的人(儘管是壓箱貨,卻未必是最差的)。在這個遊戲中他可能選平均水準,但是在現實生活中,由於別人也在追逐之中,因此這傢伙可能就沒這麼好了。所以,你有1/3的機會挑中最好的對象,至於挑到平庸之才,甚至水準以下對象的機會也一樣約各1/3。這種情況就好像是在網球比賽中嘗試發球得分一樣。 所以,再回到那個僅容許約會10次的方式,並作進一步的討論。由於最佳人選在第一群人裡面的幾率只有1/10,因此他還有90%的機會留在尚未和你約會的那90個人當中。惟一不能保證你和他結合的因素,就是當2號人選剛好也在那10個人之外,使你在和最佳人選相遇前,就選了第2號。這是因為既然他們兩人都比前面10個人來得理想,那麼根據遊戲規則,不管你先跟誰約會,你都會選擇先出現的那一位。事實上,第3、第4人選在那10個人之外的幾率也是一樣的。因此,婚前約會次數太少將會降低你和最佳人選擦身而過的機會,卻也會增加你跳過最佳人選而選擇次佳者的機會。但是這種結果真的這麼差嗎?這就要看你在100人當中若只選中次佳人選時會不會自怨自艾了好像有一點兒自負,是不是? 現在,我們知道為什麼要明確動機了。如果你的動機就是找到最好的那個人,你就不得不承認現實:沒有一個策略可以保證實現這個目標。 規避風險的決策 也許我們應該保守一點來玩這個遊戲,運用同樣的規則,但追求不同的目標。換句話說,不把追求最佳人選作為最大目標,而是設法避免挑到最差的人選,這就稱為規避風險。也就是說,在賭博的時候(你的確是在賭博,只不過不是用一般的籌碼),你應該設法減少損失而不是一味追求高利潤的報酬。就像賭馬挑品種比較好的馬,就是為了規避風險。在這樣的前提下,你的策略又會有什麼轉變呢? 確定這個前提後,就算你認為挑中次佳人選並不可悲,你也不必為了簡化約會過程,而將約會人數從36個人降到10個人。比較好的做法是,把前30個人當做樣本,然後跟前面的做法一樣,挑選下一個比他們更好的對象。這樣雖然挑到最佳人選的機會稍微降低,但是仍有高於50%的機會挑到最佳或是次佳人選。更不必到約會終了,甚至在咽下最後一口氣時選。這樣做是比較合理的,依此類推,如果你認為這100個人裡面的前5名都可以接受,那你只需要20個樣本,這樣你就有70%的機會可以找到前5名的對象,也就是說,只要動動腦筋,就有將近3:1的幾率可以遇到100個人當中的前5名。 這種比較保守的策略並不會降低挑中最佳人選的機會,只是把比率從37%降到33%,下降的幅度甚至很難察覺得出來。你只要放棄一點點獲得最大獎的機會,就能大大提高平均成果,也把找不到合適對象的幾率降低了50%。 這個遊戲有許多不同的可行策略,最適合你的策略(應該作為個人決策的指導原則),就看你的目標訂得有多清楚。你可以說我只要最佳人選,這是第一種策略,但也必須接受可能會敗得很慘的事實。或者,你可以稍微降低一下標準來減少損失。總之,你必須事先搞清楚自己到底要找什麼樣的對象。因為對於每一組清楚確認的目標而言,其相對應的策略都有不同的約會比率與等待過程。這一點應該並不意外,因為每個人在日常生活中都是這麼做的。 很抱歉,魚與熊掌就是不能兼得,所以對自己的目標就要訂得實際一點(肥皂劇和電視廣告都教你要追求最好的,但對於重要的事情來說,這是很差的決策原則。說起來,追求卓越的心態是許多已經不錯的人的頭號敵人)。實際上邊學可以邊調整目標,根據經驗和資源來調高或降低你的標準。多數人都可以靠直覺來調整目標,這就是所謂的動態策略,只要能夠明確說出想要什麼,就一定有辦法達成願望。當然沒有事情是100%肯定的,《聖經》上有「跑在前頭的未必贏」的話,但是可能你也會同意戴門·朗尼思所說的:跑在前頭的人未必贏,但是他還是你該下注的對象。 啟示:堅信自己和自己的力量,這是件大好事,尤其是建立在牢固的知識和經驗基礎上的自信。但如果沒有這一點,它就有變為高傲自大和無根據過分自恃的危險。——伏龍芝 女王選夫與最優策略 現在再來看一個「女王選夫」的故事:話說有一個女人當政的國家,女王想要選擇一個丈夫。於是她找來兩個大臣,讓他們去各地尋找。 大臣們各找回一個候選者,分別是A和B,為了衡量這兩人的實力,他們還為候選者的各項素質(健康、智慧、容貌、口才、才能、門第、聲譽)分別打分,假定打分十分公平,是否能夠選出最佳的一個呢? 現在假設,A的總分比B高,似乎選他是正確的。可是B也有優勢,在7項素質中,他有4項超過了A,1項打成平手,只有兩項落後,就綜合實力來說,他似乎更為合適。 誰更合適?其實,問題應該是哪種策略(總分決勝還是「素質比較」)更合適。由此我們也可以看出,要找出「最佳人選」多麼難(如果不是不可能)。 當然,還可以有別的辦法,比如女王親自體驗一下,根據自己的感覺決定。但是這個辦法也有風險,有些人就是中看不中用,剛一接觸使人如沐春風,可是時間一長就覺得面目可憎。感覺總是不太可靠的。 還有一個辦法就是看女王究竟最看重哪個素質,比如女王只希望那個丈夫生龍活虎,那麼智慧云云就不那麼重要了。這倒讓我們想起一個笑話:老闆要招聘一位女秘書,人事經理對幾位候選人做了細緻縝密的測試,並對每個人的素質作出評價,拿給老闆請他定奪。老闆說:「要那個金髮美腿的!」 比較合理的策略可能是將各種策略綜合起來,比如先畫定一個及格線,在這個及格線上選擇某種素質最突出的;或者掉過來,選擇總分高,同時某個素質也不太差的。這樣結果雖然不一定最好,但一定很不錯。 在我們面對選擇時,決策的核心並不在於結果的最優,而是決策過程的最優化,只要你的策略合理,結果當然也不會差。 不要指望最好結果 我們都希望找到最好的那一個,但是如果你把這作為惟一目標,你可能得不償失。 一個最重要的理由是:你很難找到一種方法來保證實現這一理想。人不是機器,不能用「型號」、「運算速度」、「行業標準」之類的東西衡量,人比任何機器都複雜得多。你也許會想到考試這種方式,其實你的考題出得很不錯,也只能反映某些素質,更不必說還有紙上談兵和口是心非之類的不確定因素。 按圖索驥也是人們常犯的毛病,好多少男少女正是以心目中的偶像(通常是浪漫影視和大眾媒體營造出的不真實的形象)作為擇偶標準。這種標準至少有兩個問題:其一是似乎認為人也像某種高檔商品,是可以批量生產的;其二就更糟糕:如果真的享受不到,就弄個假貨自欺欺人。當然,我們都希望得到高標準的,但如果你不學會降格以求,恐怕只能孤獨下去。 時間不會倒流,機會往往也是如此。如果你的標準過於苛刻,就會喪失許多本來可以抓住的機會。你一定聽過這個故事:女兒年齡漸大,還是不肯結婚,父親很是著急。女兒不以為然,說:「沒關係,海里的魚還多著呢。」父親回答:「可是魚餌放得太久,就沒有味道了。」 在愛情問題上有許多神話,人們炮製這些神話的初衷是好的,但是如果你信以為真,結果可能就不是好的了。最典型的一個神話就是所謂「另一半」:這世界上的男男女女都只是半身人,每個人都有屬於自己的另一半,而我們戀愛的目的就是要找到那個「另一半」。這說法挺叫人感動,但於事無補。它的意思是:有(而且只有)一個最佳答案。姑且先承認這一點,可是世界上和你年齡相仿的女人或男人有好幾億,而你所能接觸到的不過一二百人,指望從這個小的範圍找到那個「正確答案」,可能性約等於買一張彩票即中大獎的概率。如果某人把改善命運的希望完全寄托在中彩票上,我們會認為此人精神出了問題,在愛情上,道理也是一樣。 其實,無論是選擇愛情也好,工作也好,人生道路也好,「正確答案」只在理論上存在。與其在這上面糾纏不清,不如通過理性的態度,選擇合理的策略,爭取一個較好的結果。 啟示:愛情不是用眼睛,而是用心靈看的,所以長翅膀的愛神被畫成瞎子。一旦愛情喪失,我們就能察見所有的缺點了。第9章 美女還是才虎概率是生活的真正指南,但是我們對這一指南有著太多的似是而非的誤解。在聽任命運擺布之外,我們是否還有更好的選擇?美女還是老虎在許多決策的問題里,決策者必須單憑些片面的信息,甚至沒有任何信息的情況下,從好幾個選擇方案中挑選其中之一,這個時候,就不得不乞靈於運氣了——或更準確地說,聽命於概率的撥弄。那麼在這種情況下,還有沒有什麼更可取的策略?先來看一個著名的故事《美女還是老虎》。從前有個國王,在懲罰罪犯時有個古怪的習慣:把罪犯送進競技場,競技場的一端有兩扇一模一樣的門,門後分別關著一隻兇猛的老虎和一位美女。國王懲罰犯人的方式就是讓他自己挑一扇門,如果他選中老虎,那麼後果可想而知;如果選中少女,他不但可以馬上獲釋,還可以抱得美人歸。一天,他發現有位英俊瀟洒的臣子與公主私通,一怒之下,也把這個青年送到競技場,處以傳統的懲罰。事前,公主已經知道哪扇門背後藏的是什麼,於是相當苦惱,不知該把愛人送入虎口,還是送到另一個女人的懷抱?當命運攸關的這一天到臨時,在別無選擇的情況下,這位臣子在競技場上望了公主一眼,公主示意他選擇右邊那扇門,他打開門……故事就到此為止。只把一個懸念留給我們:他遇到的是美女還是老虎?如果你對佛理有一點興趣,你可以說「美女就是老虎,老虎就是美女」之類的漂亮話;如果你對動物學有一點興趣,你可能說「大多數老虎並不吃人」。可是假如你自己陷入了那個境地,可就沒有開玩笑的心情了。兩種選擇的結果好壞是明擺著的,可是指導我們選擇的信息卻很少,而且不可靠。除了碰運氣,我們還有沒有更好的機會呢?概率改變了嗎有一名囚犯得到一個消息:目前被囚禁的三名犯人中,有兩位將在隔天獲釋。這名囚犯非常高興,同時一位和他相處不錯的獄卒也證實了這項消息,而且獄卒甚至連釋放名單都知道,只是由於紀律所限,他不方便告訴囚犯他是否在名單里。這名囚犯(暫時稱呼他為甲,另外兩名則分別為乙與丙)很清楚他獲釋的機會是2/3,也可以理解他想知道更多消息的那份急切,他想著該用什麼方法來得到進一步信息。當然最簡單的方法就是直接詢問獄卒,他想:既然乙與丙其中有一人會獲釋,不管自己是否有機會出去,他還是可以向獄卒打聽另一個獲釋人的名字。不過他也擔心這麼直接會降低獲釋的機會。他想:如果獄卒說乙將獲釋,那就會佔去其中一個名額,換句話說另一個不是自己就是丙,那麼對他來說,這就是個對等賭局,他與丙誰也占不到便宜。這麼一問,就把獲釋的幾率從2/3降到了1/2,於是他決定不問。試問這個決定合理嗎?著名的統計學家莫斯得勒把這個問題收錄在他的暢銷書《50個具有挑戰性的概率問題與解答》中,並在書中表示:「在讀者寫給我的信當中,這個問題引起最多的迴響。」莫斯得勒的回答是:沒有,甲並沒有因為問了獄卒而降低獲釋機率,不論詢問前,或是詢問後,獲釋的概率都維持在2/3。在此暫不重述他的論證,先來看看最近一個類似且熟悉的問題,然後再回過頭來,處理論證的部分,這個問題是雜誌專欄作家賽凡特女士創出來的,問題里的邏輯困境和前面的囚犯問題完全相同。要不要改變選擇這個問題可稱之為「選擇的轉換」:你出現在一個遊戲節目里,主持人指出標有l、2、3的三道門給你,而且明確告訴你,其中兩扇門背後是山羊,另一扇門後則有名牌轎車,你要從三個門裡選擇一個,並可以獲得所選門後的獎品。當然你希望自己選中的是汽車而非山羊。既然是三選一,很清楚,你選中汽車的機會就是1/3。在沒有任何信息幫助的情況下,你選了一個(比如1號門),這沒有什麼對與不對,完全是運氣問題。但主持人並沒有立刻打開1號門,而是打開了3號,門後出現的是一隻羊。然後主持人問你:是否要改變主意選2號門?現在這就是個決策問題了:改還是不改。想一想吧!賽氏的想法大致如下:如果你選了l號門,你就有1/3的機會獲得一輛轎車,但也有2/3的機會,車子是在另外兩扇門後。接著好心的主持人讓你確定車子確實不在3號門後,不過l號門有車子的幾率還是維持不變,而2號門後有車子的幾率變成2/3。實際上,3號門的幾率轉移到了2號門上,所以你當然應該改選。跟莫斯得勒的讀者對囚犯問題的熱烈反應一樣,賽凡特的遊戲也引來數以千計的讀者來信,讀者多半是認為她的推論是錯的,主張1、2號門應該有相同的幾率,採用的也多半是囚犯的演算法,因為你已經把選擇變成2選1,也不知道哪扇門背後有車,因此幾率應該跟丟擲銅板一樣。有趣的是,賽凡特又提供一項有用的資訊:一般大眾的來信里,有90%認為她是錯的,而從大學寄來的信里,只有60%反對她的意見,在後續的發展里,一些統計博士加入自己的意見與信念,且多半認為幾率應該是1/2。賽凡特顯然很驚訝這個問題所引發的熱潮及反對聲浪,不過她仍堅持己見。統計學家從過去到今天都一直在尋求上述問題的答案,其實再簡單不過,每個人都可以理解,也可以親自驗證,在此可以來模擬一下:用3張蓋起來的牌當作門,一張A,兩張鬼牌,分別當作車子和山羊,連玩個十幾次看看。很快就可以發現換牌是比較有利的,就和賽凡特說的一樣。那為什麼這些專家還爭吵不休,究竟在3號門出現山羊後,l、2號門的幾率變成相等又有什麼問題?或者是不是所有遊戲者都有某些未言明的假設,即使用撲克牌模擬也是如此?啟示:做出和你的需要相反的選擇,將使你打個根本沒必要去打的仗。我對,你也對令人驚奇的是,儘管雙方結論完全相反,卻都是對的,這也有個小故事。所羅門王有則趣事,兩位鄰人在國王面前爭論,每一位述說完畢,國王就說:「你對!」剛好一位路過的律師聽到了,就質問國王:「怎麼可能兩個人都對?」於是國王回答:「嗯,你說得也對!」在上述的謎題里確實藏有一個未知資訊,所有的參與者,包括賽凡特,都對該資訊做了不自覺的假設,多數人甚至不知道有這個未知資訊,由於兩派都認為自己的假設清楚明白,因此應該都沒有意識它們只是假設而已。現在也談夠謎題了,該來看看到底出了什麼問題?究竟遊戲者該不該換?任何決策問題的最佳解決之道就是先釐清有哪些決策方案,現在所面對的是1、2、3號門後有一輛車,遊戲本身沒有其他特殊限制,因此大可假設這是一個公平遊戲,所以初始幾率,一如前述,每個門都是1/3,到目前為止都沒問題。現在遊戲者,就是你,選了l號門,到這兒也沒有什麼問題,因為你一無所知,所以猜對的幾率是1/3。好玩部分開始了,因為主持人打開了3號門,而沒有人問他為什麼要開3號門。這兒有幾種可能性,主持人的選擇所傳達的訊息跟你對主持人心裡那把尺的了解有關,這一點到目前還是未知。主持人可能只想玩玩票,只要遊戲者選1號,他就一定開3號門,不管3號門後是不是車,如果剛好出現羊,那運氣不錯;如果是車,那麼遊戲就告一段落,你就輸了。如果主持人真是這麼想,那麼3號門後不是車,對你來說確實是一項新資訊,這時車子出現的可能就是l號或2號門其中之一,兩者間沒有特別偏好,主持人並沒有給你換門的好理由,也沒有提供讓你維持原案的原因。多數賽凡特的反對者都相信在這樣的情形下,幾率是均等的,卻全然不知他們已經對主持人的策略做了假設。甚至也根本不知道自己已經做了假設,不過他們都很肯定自己是對的。不過,如果主持人並沒有玩票,而自有另一套規則,他心裡知道絕不能打開有車子的那扇門,因為這會破壞遊戲者作決策的懸疑氣氛,提早結束遊戲,使觀眾失去興趣,服務於娛樂事業的主持人,想吸引觀眾應該是很合理的猜測。因此,如果主持人的策略是絕對不去開有車的那扇門,那麼如果你一開始就選對了,他就可以隨他高興開2號門或3號門;如果你一開始就選錯了,那麼他就會開沒有車子的那扇門。因此無論如何,他開的那扇門後一定是頭山羊,所以不會有任何新信息。因此不管車子在哪裡,他的舉動都不會影響最初的選擇,也就是l號門的幾率。如果車子不在l號門後,那麼他開的門等於是告訴你大獎的所在,因此有2/3的機會。所以第一次選1號門就選錯了,他等於已經告訴你應該選哪一扇門。如果這是主持人的策略,那賽凡特就對的,有機會就趕快換,榮耀將屬於你。雖然換選未必保證你一定會獲勝,因為你仍有l/3的概率在第一次選擇時就選對了,不過換選還是把獲勝機會加倍。這種情況其實是因為兩方對主持人心理所做的假設不同,因此雙方都有可能是對的。如果主持人開門是隨機的,車子又不在他開啟的那扇門的後面,那麼幾率就真的各有50%。如果他早就決定好,在這個階段,絕不去開有車的那扇門,那麼他讓你先看3號門後是什麼的同時,你就應該利用這項信息而換選。啟示:珀西·斯潘塞1943年在美國雷森公司工作,他發現站在微波射線前面他口袋裡的一塊糖果很快會融化掉。他通過進一步實驗發現微波能夠製作「爆玉米花」。當他發現這一切時,他就為美國人的餐桌又增添了一種食品——在某些人眼裡太陽不過是一個黃色圓圈,而有的人卻能夠通過芥末大的微粒看見明亮的太陽。換,絕不會吃虧但最困難、最有趣的問題是:如果一切如前述,你實在不知道主持人的策略,也不可能去問。如果細想就知道正確決策跟主持人的心態大大有關,他也不會說出來。於是就只能猜測,愈能猜中主持人的心理就愈能作出換與不換的正確決策,生活不也是這樣的嗎?理性的決策不應建立在對人心的揣度上。玩心理戰術有時有用(存在即合理嘛!),但也可能弄巧成拙。你當然可以猜測主持人這樣做是為了再給你一次機會;但是同樣可能的是,此人是個為了提高收視率而不擇手段的人,甚至是個心理陰暗的人,他這樣做完全是為了誤導你作出錯誤選擇。事實上,大多數認為「不應換」的人,可能都有這樣的戒備心理。他們可能這樣想:我已經作出了選擇,對不對都只不過是運氣好不好,而一旦我改換了選擇,而又錯了,我就成了被耍弄的傻瓜。不過有一點很明白,如果不考慮任何心理因素,決定換絕不會吃虧,概率至少是一半一半,根本沒有損失。這也正是許多對策專家傾向換選的原因。這裡有一個問題:「概率」並不一定等於「結果」,這就好比買彩票,買100張彩票的中獎概率肯定要大於只買一張,但這並不排除相反的結果:那個買100張彩票的什麼也沒中,倒是讓那個只買一張的撿了便宜。關鍵不在於概率,而是概率背後的思想和情感:如公主的愛與嫉妒孰輕孰重、主持人是否掌握信息和他的目的等。說到這裡,我們不得不得出一個無奈的結論:在這個問題上,確實沒有一個保證你正確決策的方法。繞了一大圈再回到「美女或老虎」的決策,在競技場上命運詭舛的情人由公主指示了右邊的門,他也照做了。毫無疑問的,這個倒霉的臣子會想到公主內心的掙扎,判斷公主應該會作出有利她自己的決定,再據此作出自己的決策,使自己有最大的機會獲得幸福的未來。那個年輕人如果有一點洞察力,他該知道公主(他的情人)的性格傾向,他們的愛情是建立在相互關懷上還是佔有慾上,但是這種事又是不能打保票的。在這種情況下,年輕人聽從公主的指引,其實就是把希望寄托在他們的愛情上,這是有道理的。即使結局並不一定好。事實上,我們所作的多數選擇都冒一些風險,都有失敗的可能,我們所能做的,不過是盡心儘力而已。正如那句老話:豈能盡如人意?但求無愧我心。啟示:如果壞事有可能發生,不管這種可能性多麼小,它總會發生,並引起最大可能的損失。換言之,解決問題的手段越高明,我們將要面臨的麻煩就越嚴重。老虎在哪個門再來看一個「美女或老虎」的故事,它與前面的有些類似,但反映的內容不同。一位國王發現他的女兒和一個青年私定終身,非常生氣,打算殺掉那個青年。但他經不住女兒的苦苦哀求,就說:「好吧,我給他一次機會,看看他是否配做我的駙馬:這裡有5個門,其中有一個門裡有一隻老虎,他必須按照順序打開這些門。當然,他有一次機會選擇老虎在哪個門裡,除了這個門,剩下的門都必須打開。如果他猜錯了,就得和老虎打一架了。我以國王的尊嚴保證,老虎會在他意料之外出現。」這個青年當然不知道老虎在哪個門裡,也就是說,他只有20%的機會猜對。但是他想:如果我打開前4個門,裡面都沒有老虎,那麼我就知道老虎一定在第5個門,這就不是意料之外了,所以國王不會這樣做,也就是說,5號門裡一定沒有老虎。現在,他的機會上升到25%,但他還不滿足,繼續想:5號門排除了,接下來同樣的邏輯對四號門也有效:如果打開前3個,都沒有老虎,而5號又肯定沒有,那麼一定在4號,這又在我意料之中,所以,國王也不會把老虎放進4號。接著,同樣的邏輯也可以應用在3號、2號和1號,所以,國王不會把老虎放進任何一個門,因為它們都在我意料之中。青年肯定國王只是想考驗一下他的智慧,其實並沒有什麼老虎,於是他高興地打開1號門,果然沒有老虎;他又自信地打開2號,可這次老虎跳了出來……我們不必為這個青年的性命擔憂,這只是個故事,況且,他也許還是個武松式的英雄呢。我們的問題是:青年的邏輯為什麼錯了,又錯在哪兒了。大多數學者都同意青年的第一次判斷:老虎肯定不在5號門。可問題是,你一旦同意了這一步,就很難否定後面的推理也是正確的,也就是說,國王如果是金口玉言,說話算數的話(保證老虎會在意料之外出現),就不能把老虎放進任何一個門,因為每個門都在意料之中。可是悖論恰恰出現在這裡:一旦你得到了這個結論,那麼老虎出現在哪個門裡,又都成了「出乎意料」的。國王還是說話算數的!然而,我們也可以很容易證明青年的推理從一開始就錯了,即使他打開了前4個門,都沒有老虎,那麼,他真的能肯定老虎一定不在5號門裡(因為它在意料之中)嗎?不能!因為他一旦這樣確定,那麼老虎就成了「出人意料」的了!不要以為這些只是文字遊戲,它說明了一個道理:我們作為判斷依據的某些「已知條件」,會隨著事件的進程而改變。圍棋是一個複雜的遊戲,複雜之處就在於:沒有一種情況是絕對好或絕對壞的,在進程中,局面不斷變化,壞棋也可能變成好棋。比如你的一個子被對方包圍,已經跑不掉了,你就只好放著它不管,在別的地方下子;而對方一般也不會再花一手棋吃掉你這個子,因為你已經脫先了一次,如果他再吃,你又可以在別的地方走一手,那麼他為了吃這個子要多花兩步棋,這並不划算,於是他也放著不走,在別的地方下子。這當然沒有錯,因為那個子也跑不掉。但是這又不是絕對的,一旦他的棋形出現漏洞,或者你有了接應,這個子就有可能死而復生。回到前面的例子,5號門也像這個棋子,理論上「死」了,但並沒被從「棋盤」上拿掉,這樣它就有「活」的可能,並對整個局面造成影響。三張卡片在很多賭博遊戲中,如果你一味相信自己概率的直覺,就可能輸得很慘。例如,有人請你玩以下遊戲:在一個帽子里有三張卡片,一張兩面都是黑的,一張兩面都是白的,還有一張兩面一黑一白,他從裡面摸出一張(如果你怕他做手腳,也可以由你來摸),攤到桌面上,當然,朝上這一面可能是黑的,也可能是白的,現在他和你打賭背面的顏色與上面一致,你打不打這個賭?看起來,這是個對等賭局,如果這一面是黑的,那就一定排除了兩面都是白的那一張,因此,這張牌要麼是兩面黑,要麼是一黑一白,所以你的機會是一半,對不對?如果它真是公平的,對方怎麼會那麼容易贏了你的錢呢?其實這個賭局是2∶1對他有利。關鍵在於:可能的情況是三種,而不像你以為的那樣是兩種:它可能是:黑(A面朝上)-黑、黑(B面朝上)-黑、黑-白,也就是說:對方有2/3的機會贏你。再來看一個相似的例子:甲:「我向空中扔三枚硬幣。如果它們落地後全是正面朝上,我就給你10分。如果它們全是反面朝上,我也給你10分。但是,如果它們落地時是其他情況,你得給我5分。」乙:「讓我想想:至少有兩枚硬幣必定情況相同,因為如果有兩枚硬幣情況不同,則第三枚一定會與這兩枚硬幣之一情況相同。而如果兩枚情況相同,則第三枚不是與這兩枚情況相同,就是與它們情況不同。第三枚與其他兩枚情況相同或情況不同的可能性是一樣的。因此,三枚硬幣情況完全相同或情況不完全相同的可能性是一樣的。但是甲是以10分對我的5分來賭它們的不完全相同,這分明對我有利。好吧,我打這個賭!」乙接受這樣的打賭是明智的嗎?不,他的上述推理是完全錯誤的。為了弄清三枚硬幣落地時情況完全相同或不完全相同的幾率,我們必須首先列出三枚硬幣落地時的所有可能性。簡單說,一共有八種情況,而只有兩種情況是三枚硬幣完全相同。這意味著三枚硬幣情況完全相同的可能性是1/4,三枚硬幣落地時情況不完全相同的式樣有六種。因此其可能性是3/4。換句話說,甲的打算是,從長遠的觀點看,他每扔四次硬幣就會贏三次。他贏的三次,乙總共要付給他15分。乙贏的那一次,他付給乙10分。這樣每扔四次硬幣,甲就獲利5分——如果他們反覆打這個賭,甲就有相當可觀的贏利。啟示:有時候我們的命運像冬日果樹。誰會想到哪些枝條會轉綠開花,可是我們希望,我們知道它會如此。概率——生活的真正指南前面談到的每個問題,都與一個概念密切相關,那就是概率。明天會不會下雨?丟銅板會出現正面還是反面?想拿到一手好牌嗎?這些問題都涉及概率按照巴特勒的說法,概率是「生活的真正指南」。概率論已經廣泛運用於科學、技術、經濟和生活的各方面。要打好作決策的基礎,就得在概率方面多下點工夫。很少有一個學科像概率論這樣說明我們的直覺是多麼不可靠。我們的經驗甚至常識往往和概率論所揭示的答案相悖。很多人相信某一獨立事件的概率要受到過去的影響。比如在戰爭中,士兵們相信,躲在新彈坑裡比較安全,因為炮彈兩次打中同一地點不大可能。這也許有一點道理:大炮每次射擊,都可能會因反作用力使炮位稍稍移動,彈著點也可能略有偏差。但是這也只是空談,因為畢竟不止是一門炮在射擊。有一個故事,講的是一個謹小慎微的人坐飛機,他很害怕會遇上一個帶著炸彈的恐怖分子,於是他就自己帶了一個炸彈(當然,炸藥已經卸掉了)。他的理由是:一架飛機上有一個帶炸彈的恐怖分子的概率很小,一架飛機上有兩個帶炸彈的恐怖分子的概率就更小了。他認為自己的行為減低了遇到危險事件的可能性,可事實上,他帶或不帶炸彈不會影響其他旅客帶不帶炸彈。當發現我們以為「天經地義」的東西竟是錯的,第一反應是不相信,第二反應是想弄明白到底怎麼回事。自然,如果沒有一點概率學知識,想弄明白也不容易。決策的形成共有五個步驟,每個步驟都極其簡單:一、列出所有可以採取的行動,包括不採用的行動也要列出來,而決策就是從各種可能的行動方案中選出一個來:二、儘可能列出每個行動的可見後果;三、盡量評估每種結果可能發生的機會(可能性,幾率),這一點常被忽略,因此應仔細加以討論;四、試著表達你對每種結果的渴望或恐懼程度;五、最後把列出來的所有因素全部放在一起考量,做出合理的決策。我們會逐項探討後面三個步驟(前兩項步驟會隨著決策而有所不同,故在此暫不討論)。如果根本沒辦法列出選擇方案或可能的結果,那麼你一定得先解決這兩個問題,絕沒有第二條路可走。畢竟決策的本質就是從眾多選擇中,挑出一個最好的,其目的就是要達到最佳結果:如果你連選擇方案都說不出來,更別想作出任何決策。當然,也不諱言人生的確存在著未知的選擇,也會有出乎意料的結果,可惜這些實際生活中的悲劇或驚喜並非本書的主題。本章的目的是為上述的第三個步驟打好基礎,也就是討論概率方面的問題。啟示:某種事件在同一條件下可能發生也可能不發生,表示發生的可能性大小的量叫做概率。例如,在一般情況下,一個雞蛋孵出的小雞是雌性或雄性的概率都是1/2。概率,也叫幾率,舊稱或然率。概率與機會一般人一聽到概率就害怕,因為這個詞太莫測高深,聽來就很「數學」,而大多數人在數學方面又極不自信(這並不全怪我們,也要怪那些把數學變成苦役的教師們)。其實,概率與機會其實是相同的概念,不能因為數學家給它起了個拗口的名字,就把這個有用的概念丟棄。但是,這並不表示概率的深層意義也是粗糙的概念,也不表示數學家或氣象局在算概率時,不會用到深奧難解的數學,只能說一般決策用到的概率並不需要那麼高深的技巧。生活中有許多情況,即使不了解事物的運作過程,仍可順利進行。許多人在工作或休閑時都會用到電腦,他們雖然不太知道程序是怎麼寫出來的,也不知道電腦是怎麼製造出來的,對中央處理器、電腦內部零件等如何運作的認知,更是少得可憐。但多數時候,他們還是可以有效操作電腦。汽車駕駛員、電視觀眾、飛行員,以及眾多利用現代科技的人,都是如此。換句話說,就算不知道事物的運作方式,也能使用自如。這絕不是為自己的無知辯護,相反地,愈了解這個世界,生活就愈豐富、愈美滿,也愈能順利完成每件工作。有人曾說他犯過很多錯誤,但沒有一次是因為知道得太多。其實你不必在開始之前就知道一切,如果你覺得那是必要的,就註定會癱瘓、茫然,以致一事無成。概率不過是0與1之間一個普通的分數結構,也是用來測量事物發生可能性的工具。概率值為0表示絕對不會發生,概率值為1表示定會發生,至於其他數值則表示介於兩個極端之間的情形。聽起來似乎有點兒循環論證的味道……其實就是!有誰為幾率下過定義?再想想,還真有點兒深奧。先有雞,還是先有蛋這裡有個問題:究竟是概率(比如我們說的硬幣哪一面朝上的可能都是50%)決定了個別事件(某一次擲硬幣)的結果,還是個別事件結果的積累決定了概率?比如,你可能會說:「好吧,我承認,硬幣哪一面朝上的概率都是50%,可是如果我連扔5次都是正面,那麼下一次還是正面的概率就應該小於平均值,否則,整個的概率不是就偏向正面了嗎?」反駁當然容易,比如一個美國人可能不相信全世界每五個人中就有一個中國人,只因為他認識的所有人中沒有一個是中國人。原因是他的取樣太少了,範圍又太窄了。概率本身就是有趣又重要的課題,我們說投擲一個銅板正面朝上的機會是五五波,50%或是概率0.5,指的是同一件事嗎?乍看之下好像是典型的循環論證,因為如果出現正面的次數多了,就說明那個銅板是假的。西方電影裡頭戴黑帽的賭徒一碰到自己手中的牌不符合概率原則,就氣急敗壞地拂袖而去,顯然這些電影里的角色對所謂公平賽局早已瞭然於心。簡單地說,一個理性的人對賭局的預期,就是概率,信不信由你。要把這個人的想法換成數字,只要看他在賭局下注的比例,再把這個比例換算成概率就行了。拿擲銅板來說,他可能會說正反面機會各半,這時你就知道:哈,那就是0.5的概率了,下一塊錢就贏一塊。再譬如擲兩粒骰子,你想知道擲中7的機會有多少,受過教育的賭徒會告訴你是l∶5,那麼你就可以算出擲出7的概率是l/6或0.1667。這個比例也許是經過計算,也許是長期經驗累積而來,不過都不打緊。有些守舊的統計學家或數學家會急切地告訴你,這根本是胡說八道。他們說,概率是一種測量銅板在多次的投擲後,正面出現次數所佔的比率。如果發生比率剛好是一半,那麼機率就是0.5。但是,究竟是先有雞,還是先有蛋?《何為先?》一書的作者山謬爾·巴特勒說過,雞不過是蛋生新蛋的一種方法而已。只要擲的次數夠多,銅板就有一半的機會出現正面,這究竟是因為出現正面的概率0.5所造成的,或者不過是概率的定義罷了。再說,又有誰會這麼不厭其煩地擲這麼多次銅板?如果今天就得下注,你還會在乎長期結果如何嗎?從口袋裡拿出一個銅板,或是足球裁判丟銅板決定哪一隊先開球,這第一次擲的銅板又會如何?所謂長期或次數夠多又有何用?長期或次數夠多是古老而過時的概率定義,高學歷的統計專家已逐漸摒棄這種定義,原因很多,其中至少包括一點:基本上,在第一次擲銅板之前,就可以有相當的把握說出概率多寡,根本不需要擲上億上兆次,更何況法則是無法由實驗結果來定義的。絕對對稱但如果這個原則用得過於浮濫,就會出問題,因為這個推理只能用於每個可能出現的結果是完全對稱的情況下。如果告訴你,一個硬幣在平滑桌面上旋轉之後,一面向上的次數多於另一面,也許很多人會大吃一驚。其實硬幣的正反面重量分配確實不同,正面背面圖案的差別,對錢幣旋轉會造成一定的影響。所以,嚴格來說,在桌面上旋轉硬幣猜正反面,並不是一個完全對等的遊戲。在某些無法確定是非的問題上,人們常犯的一個錯誤是濫用「中立原理」。例如有人問你:火星上存在生命的可能性有多大?你並不知道,但是你想:只有兩種可能,有或沒有,所以,有生命存在的概率是50%。如果你是這麼想的,你就犯了濫用「中立原理」的錯誤了。在漫長的歷史中,這個原理曾被應用於科學、哲學、經濟學和心理學等很多領域,因而聲名狼藉。例如法國天文學家、數學家拉普拉斯有一次以這個原理為基礎計算太陽明天升起的概率,答案是將近1/2000000!為什麼會有這麼離譜的答案?拉普拉斯是如何論證的,我們並不了解,但是可以推想。就拿「火星生命」的問題來說吧:火星上存在生命嗎?「中立原理」的回答是:有1/2可能性;那麼,火星上存在最簡單的細胞生命嗎?同樣,可能性是1/2;存在植物生命嗎?還是1/2;存在低級動物生命嗎?1/2;存在哺乳動物嗎?1/2……好了,現在看看火星上不存在以上形式生命的概率:1/2乘1/2乘1/2乘1/2……結果是1/16,也就是說,至少存在一種生命的可能性達到了1/16,這和原來我們估計的1/2相矛盾了。「中立原理」只能應用於客觀情況是對稱的這一前提。不能因為答案是二選一,就認定兩種答案的可能性都是1/2。同樣的,如果你買彩票或競選總統,可能的結果不是贏就是輸,可惜這兩個結果並非幾率各半。啟示:所謂「中立原理」,是由經濟學家凱恩斯在他的《概率論》一書中總結的,大致內容是:如果我們沒有理由說明某事的真假,我們就選對等的概率來表明它的真實程度。概率的獨立和互斥性原則決策幾乎都是處理單一事件,擲銅板就是單一事件,在只能擲一次的情況下也很難看出這個銅板是不是一枚真銅板,也許會出現正面,也許會出現反面。或許是太過天真,但我們也只能假設銅板是公正的,依此來估計可能的幾率。在約會遊戲里,假設每一次約會都是一個新的追求者,其實這就是一種賭注(真實生活也是如此),但是你不能在開始決策前,每次都跟100個人約會來決定幾率的大小。因此,所謂的決策幾率是指0到1之間,用來測量某件事發生可能性的數字,而這個數字可以利用各種方便的技巧來推測。即使必須去問專家或數學家也無妨,只要記得找個好的就是了。如果要用猜的也可以,但千萬別高估自己的技巧,可惜這也是很多人常犯的錯誤。也許有人比你更了解情況,對幾率的預測也比較準確,如果能找得到這樣的人來幫你,儘管去吧。但是千萬記得對只會唬人的預言家敬而遠之,譬如觀天象、讀掌紋、看水晶球的各種算命大仙,都應該列在謝絕往來的名單上。話雖如此,很多人還是蠻信這一套的。當然,概率也不是完全隨機的,在計算概率時,還是有規則可循,內容並不多,但很明確,主要是避免掉入自相矛盾或無稽之談的泥沼。譬如要計算兩個獨立事件都發生的概率就是將個別概率相乘,如果一個5分錢的硬幣,每兩次有一次出現正面的機會(概率為0. 5),那麼兩個硬幣同時擲出正面的機會就是l/4,也就是概率值為0 .25。同理,兩個硬幣至少有一個出現正面的概率為0.75。兩個硬幣同時出現反面的概率也是0.25。因此無論如何,只要給定概率值,就必須嚴格遵守結合兩事件發生的概率原則,否則會出現不一致的現象,阻礙整個決策過程。以下就是三項基本的概率原則:1.兩個完全獨立事件,同時發生的概率是個別發生概率相乘的結果,兩事件以上的情形亦同。2.兩事件互斥,至少一件事發生(或說兩者不能同時發生)的概率是個別概率的總和。若不是彼此互斥,情況就稍微複雜一點。3.如果某種情況註定要發生,這些個別獨立事件的發生概率總和等於一。例如足球聯賽中一定有一隊會獲得冠軍,則所有球隊獲勝的概率加總起來定會等於一,而且各隊獲勝也是互斥事件。雖然這些原則看起來並不難懂,只要用到分數和小數相加就可以了,這些常識每一個高中生都該學過。但概率問題的複雜性還是會造成一些困難,並使很多人作出不利於自己的錯誤決策。啟示:在日本有一種邦賽樹,當它的樹苗剛長出地面,日本人就把它拉出泥土,扎住樹榦,結果它就成了一種美麗但高不過幾寸的樹。在美國加州有一種將軍莎門樹,它在加州肥沃的土地上自由地瘋長,長成後竟然可足夠建造35間房子。然而,當這兩種樹還是種子的時候,重量都小於三千分之一盎司。樹不能選擇命運,但上蒼賦予人類的許多寶貴禮物中,「選擇的權利」就是其中的一個。第10章 賭場:醉鬼漫遊反對賭博不只是一種道德立場,也是一種明智的策略選擇。當你參加一場賭博時,你贏的機會是負的期望。當你使用一種賭博系統時,你總要賭很多次,而每一次都是負的期望,絕無辦法把這種負期望變成正的。為什麼賭博是壞事薩繆爾森的《經濟學》被認為是最好的經濟學入門讀本,半個多世紀以來已經發行到第17版。薩繆爾森《經濟學》在講了「投機」以後,有一節的標題就是「賭博和邊際效用的遞減」。薩繆爾森說:「為什麼賭博被認為是很壞的事情呢?最重要的原因可能是在道德、倫理和宗教方面,但是從經濟學上看,反對賭博的理由也相當大。「首先,即使莊家不取抽頭,不搞別的花樣,賭博也只是毫無益處地把金錢從一個人手裡轉到另一人手裡。賭博並不創造新的價值,卻要耗費時間和資源。所以,除了小金額賭博還有某些娛樂功能外,賭博危害社會並減少國民收入。「賭博的第二個壞處是,它趨於擴大收入的不平等和不穩定。不平等和不穩定為什麼不好?眾所周知,增加100元收入帶來的效用小於減少100元收入而損失的效用。所以,即使在機會均等的『最公平的』賭博中,輸家效用的損失比較大,贏家效用的增加比較小。可見,從整體上說,即使是『最公平的』賭博,對社會也沒有好處。」薩繆爾森所說的第二個原因涉及經濟學的重要原理——邊際效用遞減原理。邊際效用遞減原理說的是:消費者在消費物品時,每一單位物品對消費者的效用是不同的,它們呈遞減關係。舉個簡單的例子:對一個餓著肚子的人來說,第一碗飯給他的效用最大,第二碗飯則沒有那麼大了,吃到一定程度後,再吃的話,飯給他的效用是負的,即不僅不能給他好處,反而是負擔。對買車的人也一樣,當他買了第一輛車時,他感到方便很多,同時有巨大的心理滿足感。當他買第二輛車時,由於他不能同時用兩輛車,這第二輛車給他的效用就沒有第一輛車大。當然第二輛車還能起到備用的作用,而且會增加他的炫耀資本,此時總的效用是增加的,但增加的幅度沒有他買第一輛車時增加的幅度大。如果他繼續購車,買了車後,既要雇司機,又要準備停車的車庫,同時要防範竊賊等等,這些成本反而可能高於第三輛車給他帶來的效用,是得不償失的。想想看吧,兩個月收入都是1000元的人賭博,賭到一方輸光為止。一個人變成窮光蛋,另一個人收入加倍。這給社會帶來的,將是什麼前景?後者的收入增加,只可能會讓他過得更舒服一點,可前者卻陷入了無法生活的困境。這個結果既不利於社會公正,也不利於社會穩定。啟示:薩繆爾森曾經說過:「增加100元收入所帶來的效用,小於失去100元所損失的效用。」這正是邊際效用遞減的表現。「賭徒謬誤」既然是必輸的遊戲,為什麼還有很多人樂此不疲呢?賭徒和偶爾一賭的人不同。每個人在某些時刻都想贏一下——屏住氣息,只求命運恩賜這一次!這是普遍的渴望。在各種彩票遊戲中,只要有人贏大錢,別人就開始夢想。這是此類賭博的目標;真正的報酬是夢想。賭徒又是另一回事,他真正等著贏錢。他投下的不是象徵性的小錢,而是能毀掉他的大數目。他有一套制度——在對策論中,這被稱為「賭徒謬誤」。在輪盤賭中,最常見的行為模式是所謂「戴倫伯特系統」,它正是以「賭徒謬誤」為基礎的。比方說,賭輪盤的時候他押紅的,失敗的時候再加倍。根據數學的概率法則,不管前面出現過多少次黑的,每次你押紅的,押中的機會仍是50∶50。但是賭徒認為,黑色若連續出現幾次,下回紅色出現的機會就隨著輪子的連續性轉動而比例增加。即使這不合數理原則,賭徒心中卻愈來愈堅信紅的該來了——就算這次不來,下回一定會出現,於是下次更加肯定。這使他更相信自己會贏,他知道他會的,雖然事實上機會永遠一樣50∶50。我們可以說,常勝的賭徒就是靠運氣而自以為通曉了某些奧妙的人。(當然,必須考慮技術因素:有些人打牌或作弊的技術高。)如果運氣一直證明他的預感和先見之明——統計上一定會有幾個這麼幸運的人——他心裡就產生「不會輸」的感覺。事實上,他只是運氣好,但是他的運氣碰巧合乎他自覺幸運的信心,使他很容易相信自己的運氣是特殊的神恩,專門賜給天之驕子。他相信自己註定要贏,他的勝利具有命中貢品的意義。這種人渴望,有時也獲得的是「優異」的感覺。他要證明,命運偏愛他。否則富家老太太何必一夜一夜耗在俱樂部的賭檯上?她們要用錢來算命。古代紙牌、數字、骰子在算命、魔術和占星儀式所扮演的角色就指出了其中的關係。但是賭徒不只是接受紙牌的預言,他也想向不溫厚的命運強討勝利。當他的數目不出現,他就越戰越勇,加倍下注,一直提高賭金。在他大膽或絕望的嘗試中,他會一舉贖回所有的損失。由這種行為看來,賭徒是一個幻想自己必贏、卻表現出堅決失敗典型的人。啟示:一對年輕的夫婦到拉斯維加斯度蜜月,剛到飯店,丈夫便衝進賭場豪賭一番。最後一天,丈夫將他們留作紀念的最後5塊錢籌碼押在了17上,竟然奇蹟般地贏了。不到一個小時,他居然贏了2000萬美元,而且都是押在17上。這位男子想乘勝追擊,將所有的錢都押在17上,這次小球停時一偏,開出了18。他垂頭喪氣地回到房間,太太問他:「手氣怎麼樣?」「還好,只輸了5元錢。」「開天眼的人」與不存在的規律比起賭博,彩票更為人接受。因為它不像賭博那樣,籠罩著欺詐和非法的色彩。儘管贏的概率更小,但輸的損失也不大——如果你每次只買一兩張,那不過是微不足道的小數目。但我們照樣能得到同樣的激動。現在很多報刊開闢了與彩票有關的欄目,主要內容是各種「猜號」技術。它們都是「彩民」創造的。有用嗎?概率專家說沒用,但還是有很多人信這個,或者說,是相信一定有什麼辦法可以揭示彩票的奧秘。一定有個答案的!這些人在信仰的虔誠方面,和那些一心尋找人生意義或上帝旨意的求道者其實並無不同,而且邏輯也類似。在賭博時,骰子在一輪中連續4次開出了7,下一把你是否應該在7上下重注?你的一位一貫有好運氣的堂哥為你選了一注號碼,這是否增加了你中獎的機會?這類問題的答案都是「不」。儘管人們總是渴望知道事物的發展趨勢和方向,但隨機現象就是隨機的、任意的。骰子和彩票既沒有記憶也沒有良心——每一輪、每一個數字選擇都是一次新的不同的事件,不受以前事件的影響。如果上一輪的結果能夠按照可預期的方式影響下一輪的發展,賭場就要破產了。如何對付隨機猜測陷阱?要避免這種扭曲的思維,必須克制住自己在隨機事件中預測事物發展趨勢和方向的慾望。缺乏模式(規律)是隨機性的特徵。聰明人能發現其他人看不到的規律,而「開天眼的人」能看到其實並不存在的規律。大數學家、博弈論的創始人諾曼說過:「任何一個考慮用數學方法製作隨機數字的人當然是處於犯罪狀態。」好運氣不是經常遇到的,即使是在並非特定的事情中也是不會經常出現的。運氣會造成一些令人疑惑的事情。如果你將一個硬幣連續用手彈10次,硬幣正反面出現的可能順序是:正正正反正反正正正正。10次中有8次正面,其中連續出現4個正面!難道你對硬幣施加了某種心靈控制嗎?是不是此時你的狀態或運氣特別好?似乎其中有一種不可能改變的規律性。但是,當連續得到硬幣的正面之前和之後,如果繼續彈這枚硬幣,在一個排列更長,而且稍微令人感到有些乏味的順序中隱含了這樣一種規律:正正反正反反正正正反正反正正正正反正反反正反正反反。如果允許你只注重某些結果,而不管其他結果,那麼總是能夠「證實」運氣中有意外情況。這是謊言探測裝置所探測出的一個錯誤結論,運氣僅僅是你最喜歡的狀態而已。不要試圖看透和預測純隨機事件,因為這是不可能的。如果你認為自己已經發現了將來的結果,那麼仔細地檢查你的理論。把你那套認為可以戰勝莊家的理論拿出來,將過去的數據代進去,驗證你的理論是否可行。這麼做十分有效,因為可以避免損失實際的金錢。啟示:最重要的是要巧妙掌握進退,也就是要膽大心細並洞察先機,倘若無法做到這兩點,那麼就無法找到賺錢的正確途徑。為什麼買彩票我們強調過金錢的效用和總數不見得相等。因為在多數情況下,大部分人都會覺得輸錢的痛苦此贏錢更深,所以,他們根本不應該玩對等賭局。但當需求十分迫切,就會讓贏錢的幾率比輸錢的可能性具更高的價值(且不論道德問題),此時,他們「最正確」的決策就是去賭博,即使有預期損失也無所謂。適當的評估金錢效益或其他事物,都可以改變原決策。這也是人們買彩票的原因,由此可以看出,彩票的收入比付出要多,也就是說買彩票的人多半是輸錢。所有的數學家(注意,用到「所有」這個字眼的句子通常都有問題)都不建議買彩票,不過一般人還是照買不誤,把10賭9輸的教訓完全拋到九霄雲外。不過,他們也未必全然無知。一位著名數學家在一場演講中承認:他曾經在回家路上的迷你超市添購日用品時,用找的零錢買了彩票。他的辯解大概是這樣:「贏100萬可以完全改變我的生活型態,輸幾塊錢卻毫無影響。」他其實是在為錢的效益下定義,並強調贏的效益遠大於輸的效益。可惜他忘了考慮微乎其微的中獎幾率,這點很可能會扭轉決策方向。許多買樂透的人也有同樣下意識的評估,並自我安慰:總有人會贏嘛。但在這種逆效用的情形下,即使將幾率納入考量,還是可能導致賭博的自衛決策。把巧合神秘化的「驚奇陷阱」一個人曾經兩次贏得百萬分之一的彩票大獎。這種事情發生的概率只有一萬億分之一。一些人將之歸功於超人力量,另一些則認為有作弊的嫌疑。你如何看這個事件?乍看起來一個人兩次贏得百萬分之一的彩票大獎是如此的不可能。好吧,我們假設有1000人曾經贏得了一次大獎,他們又都嘗試了100次試圖再次獲得好運。那麼就在百萬分之一的大獎中佔了10萬次機會,即這些人中的任何一人的中獎的概率為1/10。這麼看,你會發現其實它並不是奇蹟,甚至不能稱為很少發生的事情。與隨機猜測陷阱一樣,驚奇陷阱源於不恰當地估計現實。現實中本來就有一些驚奇的成分,而人們或者沒有意識到,或者不願意承認。許多人因為賭博連連贏錢(或者投資非常得意),就以為自己運氣特別好,或者水平特別高。我們不應該被這些戲劇性的事件所迷惑。從概率上來說,總有些人會走運。這個人恰好是你的概率可能極小,但是在某些情況下這個人是某人的概率可能就不那麼小了。一些有錢人之所以勝出,可能不是因為他們的生意頭腦,而只是走運罷了。一些不幸的人可能不是因為愚蠢或者無能——他們只是不那麼走運罷了。當巧合發生時,人們總是容易受到迷惑。他們不能接受隨機事件的任意性,傾向於用神奇的、超自然的力量來解釋事件,並且對自己也迷信起來,以為他們自己一定是有某種過人之處。怎樣對付驚奇陷阱?當一件看起來稀奇的事件發生的時候,不要吃驚到拋棄概率的法則和邏輯,而相信所有的稀奇事件都是註定的這種地步。在古代,沒有人有現代的概率知識,所以自然而然地認為有更高的神力在主宰這些不可預知的事物。而除了與這些神力溝通,請他們去改變人們看得見、摸得著的具體事務外,還有更好的方法嗎?到目前為止,還是有許多人相信紙牌之類的東西可以算命,由此看來,這種想法的生命力還很強韌,而對常識實在是一大侮辱。就最簡單的遊戲而言,決策惟一要考慮的問題就是決定要不要玩,及要下多少賭注。吃角子老虎,可說是最簡單的,賭徒除了喂它們錢,企盼也許它們會仁慈點還一些回來以外,大概也不能怎麼樣。而玩吃角子老虎的人甚至對概率多沒有半點概念,雖然他們很肯定一定會對自己不利,所以玩與不玩的決策可說是在完全無知的狀況下作出的,正因為如此,才有無數的人在註定會輸的情況下繼續賭下去。啟示:通常你能夠為自己的好運找到一個很好的解釋。記住下面幾點:(1)世界上本來就有很多潛在的稀罕事,你肯定會經歷其中的一些。(2)有些事情看起來稀奇,實際上並不是。比如,在24個任意選擇的人們中發現兩個生日(月和日)一樣的人的概率有多大?答案是超過50%!你有多僥倖在玩牌或下注時,一般人多半知道如何利用概率來判斷拿不拿得到同花順,或是哪一個球隊有可能登上超級盃足球賽的冠軍寶座。而所謂的決策,其實就是在教導我們如何更有效地應用同樣的原則來處理生活問題。個人決策之所以會有不確定性,通常是因為我們根本不知道想通過決策達到什麼目的,而且一般人都有誇大潛在損失和獲利的傾向。儘管大家都知道賭場老闆與彩票發行者的經營目的絕對不是要送錢給別人,但是一般人還是照玩吃角子老虎、照買彩票。既然賭場老闆、彩票發行者都要賺錢(不賺錢的,早就被淘汰了),一般賭徒終究要輸錢(這被稱為零和遊戲,越賭到後來越是如此),但是賭徒還是幻想著贏錢。「下一個獲獎者就是你!」這句彩票廣告撰稿人老掛在嘴上的一句話,就是過度誇張潛在獲利,總有人會贏並不表示你真有贏的機會。儘管輸錢的痛苦比贏錢的快樂更深,而且上面的道理人們也並非不知,但當需求十分迫切,就會讓贏錢的幾率比輸錢的可能性更具高的價值,此時,他們的決策就是去賭博,即使有預期損失也無所謂。所謂理性決策是希望能幫助你「平均而言」儘可能作出最佳決策。如果你是理性的,也不可能百戰百勝。賭徒也很清楚,就算運氣再好,也不可能整晚或整個禮拜一直贏下去。如果人們能謹記概率無所不及的影響力,就不會有人成天老抱怨倒霉,或走了點小運就沾沾自喜。話說回來,就算今日的世界比較文明,有些事情還真是只能碰運氣。許多關於概率的暢銷書都會引用這個例子:把一些猴子放在打字機前,經過一段時間後,其中一隻很可能會打出一篇莎翁的14行詩。事實上就算集合了全宇宙的分子數量也不足以構成這麼多猴子和打字機來做實驗,但又如何?那些作者不過想表達這並非完全不可能罷了。如果真的發生了,也不代表那隻猴子是莎翁投胎,只是更證明了幾率原則的正確性。即使不作弊,大爛隊也有贏球的時候,明星球隊一樣會輸球。賽馬場中從頭睡到尾的人也不是沒贏過,就好像完美的決策也會產生壞結果,差勁的決策卻產生好的結果一樣,世事多變,誰能說得准呢?不過,強者贏的次數通常比弱者更頻繁。要作出理性的決策,首先必須仔細衡量所有可能的後果以及可以採取的行動,並誠實考慮潛在的利益與損失。由上述各點可以假設,所謂決策其目的是去採取或避免某種行為,或以不同的方式來達到目的。資料的整合是通過預期效益或預期損失的方式來進行,即把可能結果的發生率加權給分:愈有可能發生的,加權分數愈高;愈不可能發生的愈低。也就是把各結果的加權值乘上它的幾率,再加總即為某一決策的預期效益,這個數值可以讓你知道該項決策會帶來多少好處,所以當然愈高愈好。啟示:一隻燕子為了築巢,飛到羊身上去尋找少許的羊毛。羊憤怒地跳來跳去。「你允許牧人把你的毛通通剪光,卻連一小撮毛都拒絕給我。這是為什麼?」燕子說。羊憤怒地回答:「因為你不像牧人那樣懂得用好的方法來取我的毛。」想掙錢和發財是現代人的基本願望,可是許多人的掙錢方法太落後了。預期是幾率乘以價值這裡之所以強調「預期」,是因為任何事件所產生的真正損益都與其實際發生的概率有關。譬如可以贏得10元的對等賭局中,期待值就是5元,也就是此賭局的市場價值。比如,一張彩票百萬分之一的機會贏得100萬美金,則期待值為1美元,也就是它的賣價。一般人下單時的股價反映個人的期待值,即未來獲利和再賣出的價格。而這個把幾率乘以價值的概念也是大家所熟悉的,這是了解賭博策略的最佳途徑,決策的期待值也適用相同原理。就以風靡一時的辦公室足球賭局為例談起。這是種熟悉的簡單案例(雖然老闆們多半不高興),它的賭法通常是把當天的足球賽都列出來,讓人下注買某隊會贏。賭局的全部收入就是各人買球隊贏所付的賭金,最後由優勝者平分。這個遊戲很單純,你可能認為只要比對手多了解各球隊情況即可,這當然沒錯,比別人聰明,知道得比別人多,絕對會有幫助,但這個遊戲還有點小花樣。大部分的足球賭局都允許下注者選好幾隊,以「分散風險」,反正頂多是賭金總數增加,有利無害。不過這也表示每個人都必須做兩個決策:要買多少支球隊,以及買哪些球隊贏。這也是一種零和遊戲——所有投進賭局的錢全部由優勝者平分。分散下注絕對有利於樂透彩或賽馬(這並不是真正的零和遊戲——贊助商可大撈一票),買得愈多輸得愈快。這跟之前的論點相同:若每項投資都賠錢,就算賣的量再多,也不可能賺錢。但賭足球則正好例外:多買幾隊,跟自己對賭是有利的。聽起來有點違反常理,下面就來看看它是怎麼運作的。為了簡化說明過程,我們假設這天剛好只有一場比賽:紅藍對抗。而且只有你和阿福兩個人下注,你們在挑隊伍方面都是能手。若這兩隊實力相當,這幾乎是五五波的賭局。阿福用2元買紅隊贏。現在輪到你了,你可以挑紅隊,也可以選藍隊,或者作更明智的選擇。如果你也買紅隊,那麼誰也贏不了誰。紅隊贏了,兩人就平分賭金,每人拿回自己的2元;如果藍隊勝了,還是可以拿回2元,因為沒有獲勝者。但若你賭藍隊,那麼就可分出勝負,並拿到全部賭金。假設你真的比阿福更了解球隊的狀況,就可以這樣賭,如果不是,再加上兩隊真的實力相當,則輸贏的機會大概一半一半,最後還是勢均力敵,所以絕非致富之道。但如果兩隊都買,又會有什麼結果?現在在全部賭金里你有4元,阿福有2元,而這4元中,一定有2元會贏,另外2元會輸。但就算贏的部分一定有你,又該怎麼創造凈利呢?因為這是個對等賭局,所以紅隊有一半贏的機會。若紅隊真的贏了,你們一起平分6元的賭金,所以在4元投資中可以拿回3元,另外1元則由阿福賺得。但若藍隊獲勝,這還會是個對等賭局嗎?你可以收回所有的投資,並賺到阿福的2元,作為報酬。也就是有一半機會賺2元,一半機會賠1元,長時間看,你的贏面還是較大。每玩兩次就可以凈賺1元,以4元的投資來說,平均每玩一次,就有0.5元的凈利。這當然是因為和自己對賭的結果。阿福如果要贏就必須看得很准,猜中的幾率約要有2/3才行,至於你的準確度就無關緊要,反正兩隊都押了。如果每周都有一場賭局,而阿福只能猜對一半,那麼你的每周平均報酬率就有12%強,這算是相當不錯了。一年內,你的投資會增加到將近500元,這就是複利的魔力,而阿福當然早就追上來。如果下注者更多,或比賽隊伍增加,賭局就會愈來愈複雜,利潤也會下降,不過原則還是不變,分散下注絕對有利。請注意,不要急著把這套「系統」用在足球賭局上浪費金錢,因為我們事前已經假設對手輸贏機會各半。所以,能做的不過是丟銅板決定下注對象罷了。如果對方對球隊真的很有研究,也經常挑對球隊,那麼這個系統就一無是處了。這個計算是以幾率為基礎,但若有人真的能猜中哪一隊會贏,就可以輕易擊敗信息較少的對手。有一個職業騎師被問及是否曾賭過馬,他坦率地答道:「除非有人事先告訴我內定誰贏。」我們學到寶貴的一課:如果對手知道得比你多,千萬別賭。啟示:只要有百萬分之一的機會,就有百分之百的賭徒存心要贏。選銀行還是選賭場用一個簡單的例子來分析這些原則:你該把儲蓄投資在風險低的債券存在銀行,還是乾脆上賭城一賭?這就需要決策了。首先,你必須對幾率略知一二,再評估各種後果,並決定個人目標,然後在立即滿足或未來展望之間作取捨。假設你手邊有1000元,又剛好住在鬧區,巷口有家銀行,對街有一間賭場。銀行的利率是5%,賭場里的輪盤遊戲也蠻吸引你的。典型的輪盤有38個洞,其中18個是紅色,18個是黑色。小球滾到紅、黑洞的機會一樣,不過並不完全是對等賭局,因為小球進每個紅、黑洞的幾率都是18/38,約相當於0.4737。所以不論賭紅或黑,獲勝的幾率都很低,比賭骰子的0.4929還小。換句話說,賭骰子比輪盤更容易贏錢。首先,你必須設定目標,這是決策的最高指導原則。如果打算賭到破產為止,那還有什麼問題?因為賭場贏的幾率就是比你高了那麼一點點,長時間下來你必輸無疑,結局只有一個:一窮二白、欲哭無淚。至於會不會因此學聰明,就得看你自己了。如果你選銀行,那就比較容易分析,你會立刻賠上全部投資,換到本小冊子或一張存單,表示你的錢由銀行保管,當然也可以隨時領回,但縱使是銀行也有破產的可能,同時錢只要在銀行,對你就毫無用處。這種說法當然是誤導。利息會累積,也會忠實地記錄下來,可能還是記在那本小冊子里,同時自己也知道隨時可以取回本金與累積的利息,但放棄立即使用金錢的報償,比起必輸的賭博似乎還是比較好的選擇。許多勸世文章談到,若每天以複利算(現在有電腦的銀行都這麼做),大約100年,投資1000美金加上累積的利息,便可增加到15萬,但也許你會問,這又有什麼好處?反正也沒有機會享用。取得的時間愈久遠,金錢效用愈低,這就是為什麼銀行要付你利息,才能拿到你的錢(暫時不論通貨膨脹的問題,它就像浪潮起伏,改變了一切以貨幣衡量的事物其表面價值),事實上,除了收入固定或儲蓄的人外,它不過是個幻覺。但通貨膨脹的功能正是把錢從這些人身邊拿走,搶走他們的積蓄來支付其他人的立即需求,反正除此之外,也沒有其他合法渠道可以讓人免費取得財物。若你對這個問題感興趣,可以好好思索它的道德層面。啟示:心理經濟學家曾經提出一個所謂的「劃分心理帳目」的概念。這種概念反映了一種最常見的,也最浪費的財務錯誤——把某些錢看得不值錢,因此可以輕易揮霍掉。說得更明白一點兒,「劃分心理帳目」意指人們根據錢的來源、存放的地方和花用的方式,將金錢加以歸類,並賦予它們不同的價值。加大賭注,挑戰幾率即使如此,長久下來,選銀行還是強過賭場,因為賭博的結果一定是破產。如果一定要賭,那麼最好的策略是什麼?當然,我們說「賭博的結果一定是破產」,並不排除某一時段可能你的運氣不錯,但是如果你持續下去,好運不會伴隨你多久的。這就是為什麼事前必須定出明確目標,並在達到預定目標後立即收手。趁走運的時候停手你還有機會贏,如果堅持賭到最後,結果一定必輸無疑。這也是這個問題如此引人入勝的原因。假設你帶著1000元進賭場,並決定賺1倍就收手。早期玩骰子有一句名言「我的孩子需要一雙新鞋」,就是告訴別人你急需額外的1000元買件重要的東西,原先的1000元不夠,一定要2000元才成。你當然很清楚自己極可能會輸得一乾二淨,不過當需求如此殷切時,也就顧不了這麼多;而銀行對短期需求根本是死路一條,就算以5%複利計算,也得要14年才能讓本金加倍,到時孩子早已不需要這雙鞋了。那麼又該如何在輸光前贏到1000元,再趕緊收手,把籌碼換回現金?人人都知道沒有100%的勝算,但至少可以把機會極大化。這是個定義明確的數學問題,所以就直接把答案說出來,另外,醉鬼在斷崖邊漫步的例子,也適用於此:他從一張板凳和斷崖的中間點開始走,希望找出最佳機會,在跌落斷崖前安穩地坐在椅子上。這張板凳好比那雙新鞋或是其他急需的東西,而斷崖呢?跟前面的討論一樣,代表破產。還記得遊戲規則是一次得下20元,那麼標準答案就是在輸光前約有1/200的機會可以賺得一倍,勝算渺茫,幾乎是肯定會輸,也就是說為了滿足需求而去賭博是很差勁的決策。但即使在賭場,你也可以有更好的表現。如果一次賭50元,進行速度會快一點,也許少了些樂趣,不過將本金加倍的機會就增加到1/10,比原來高了近20倍。為什麼?因為達成目標所需的運氣不用那麼多,而每賭一次,就是跟概率作一次挑戰。偶爾概率法則會讓你不致一路輸下去或贏下去,這是運氣。如果真的那麼需要錢,你也願意吸收所有損失(這個幾率很大),那這樣的概率算是可以接受的。現在應該都很清楚了,如果並非因樂趣,而是急需用錢才賭,最好的就是一次就把1000元全押下去。那麼勝負大概一分鐘以內就可以底定,而贏的幾率只稍稍低於l/2。這比一次賭20元的1/200好太多了。當然如果賭博只是為了好玩,最好一次只押一點點,雖然到頭來一樣會輸光,不過得等上好一陣子,而你一定會玩得很愉快(賭場的賭徒看起來似乎並不快樂,不過這是另一回事)。如果你賭博是想大發利市,而且也願意承擔損失,那麼就乾脆賭一把大的,孤注一擲,這樣你獲勝的概率還大一些。何時應選擇「孤注一擲」絕大多數賭博遊戲其實都是一樣,背後邏輯很簡單:長期來說,你幾乎肯定會輸,不過在遊戲過程中,也許會有領先的機會,因此如果策略對頭,也許可以在領先時收手。當然,如果對你而言遊戲樂趣大於成本,那麼只要很清楚要付出的代價,倒也無妨。對輪盤遊戲,還有兩小點要附帶一提,而它們也適用於擲銅板,及其他幾率對等,或接近對等,且籌碼也對等的情況。在輪盤遊戲里,如果帶著1000元進賭場,並希望在最後離開時口袋裡會有2000元,那麼最好的策略就是一次全部下注,如此一來,就有近一半的機會可以贏,如果你的需求不只這樣,而是想把1000元變成1萬元,那麼會有多少獲勝的機會?最佳的策略又是什麼?其實原則仍然不變:每次下注大點,仔細留意形勢的變化,持續賭上一陣子即可,也許你會輸光,但至少有贏的機會。但如果你把所有資金一次全部下注,運氣又很好,連贏3次(幾率大概是1.8或再低點),賭金可累積到8000元,那麼下一局是不是還應該再這麼干呢?錯了!因為你可能會為了遠遠超過設定目標的l.6萬元而輸個精光。這時最好的策略應該是下注2000元,如果贏了,你大可以帶著所需的1萬元離開賭場,萬一輸了,也還有6000元可以翻本,下面賭局,就把注碼改成4000元。因此,這類賭局的最佳策略是,只要贏得的錢不超過目標,就全部押上,要不然就只下足夠達到目標的賭注就好。從數學上也可證明,是有和這個策略不相上下的做法,但絕沒有更好的。有個跟這個策略差不多的玩法是,在一開始,假裝你的目標是5000元,運用前述的方式,希望能達到目標,如果機率是l/5,那麼在你確實賺得5000元後,再全部押上,這個方式的獲勝幾率跟先前一樣,不過前提還是輸贏幾率必須接近各半。最後還有一個問題:如果採用最適策略的話,希望把1000元本金,連本帶利翻成1萬元,成功的幾率究竟有多少?假如你想賺取10倍於本金的錢,即使採用最佳策略,成功機會也不會大於1/10,這是公平遊戲的通則。在破產前達成目標的概率,正好是想賺得金額的倒數,若遊戲不公平,概率還要比倒數小一點,這雖不是那麼直觀,但千真萬確。同時,若遊戲的公平性差了一點點,而你又小心翼翼地下注,肯定你會輸。在公平賽局中,有近1/2的幾率,可把本金變成2倍,3倍則為1/3,以此類推。這個通則其實是很有根據的,在幾率的世界裡,恰巧也就是人們生存的世界。財產預期值等於幾率和總數相互影響的結果,也就是說,擁有10元現金和擁有一張有機會把錢增加1倍的對等賭局彩票,就長期而言兩者並無二致,幾率都是1/2,但若是可把錢變成100元的彩票,幾率就減小為1/10;雖然兩者的預期值都是一樣,沒有改變,但心理上,卻有很大的不同,因為若將時間拉長,結果正好打平,不賺不賠。這個原則值得謹記於心,因為它是個通則。當然,這也表示如果幻想在賭場里致富,那麼即使採用雖佳策略,機會也很渺茫。想像一夜致富的情景當然很有趣,但終究只是想像而已。啟示1:如果金錢和財富是可以互換的,不論是賭博贏來的彩金或辛苦賺到的薪水,使用起來都應該沒什麼兩樣。任何財務決定,都應該是根據一件事對我們的整體財富有何影響,來做理性的衡量。啟示2:很多入迷的賭徒不知不覺想要輸。不懂概率,當定冤大頭在較為複雜的賭局裡,比較不容易計算概率,撲克牌就是一例,不過認真的玩家還是算得出來。撲克的複雜之處還在於,它是個競賽性遊戲,強手佔有一定優勢。而擲骰子就要簡單多了,相信每位讀者現在都算得出來擲出4或10點的幾率是1/3。有時概率會騙人,或未知,或被忽略。彩票遊戲里,一般人若不是不了解中頭獎的概率,就是他們只看到報紙上得獎人的故事,所以毫不在乎幾率的問題。對這些人來說,「中獎的可能就是我」的幻想蓋過一切,但若以錢的效益來看,這樣想未必完全沒有道理。不過再怎麼說也不能太離譜,有的賭場宣稱:在自己的撲克機上拿到同花順的概率是500∶1。聽起來好像很高,不過在公平賭賽中,取得同花順的概率就像連續拿到4張同花牌一樣,熟手發牌,則接近1/1000000,更精確點是1/649740,如果是抽牌,則低於1/20000。這麼看來,1/500根本是無恥的謊言,用來欺騙不懂的人。其實,如果說在這些用適當策略達成目標的賭博小原則之上,還有共同決策原理的話,那就是如果你不懂概率,即使只純粹想限定輸錢的金額,也沒有合適的策略可用。這個原則的惟一例外是,不賭就不會輸,那麼懂不懂概率就無關緊要了。前面我們用了很多紅黑輪盤作為簡單遊戲的例子,但必須記住,縱使賭注是l賠l,贏的幾率也只有47.37%,因此有52.63%勝算的賭場,足足比你多了4%,就長期而言一定可以獲利的。再強調一次,賭場老闆不是在經營慈善事業,所以長期來說,你是不可能贏的。當然不論是輪盤還是骰子,都有很多未曾提到的賭法,每一種又各自有合適的策略,若要在這裡談會佔去太多篇幅(這畢竟不是一本《賭經》),所以只要記得一件事,就是一定要懂得幾率,千萬不要盲目下注。以上討論的前提是假設所有遊戲都是公平的,對這一點,我們必須保持懷疑,因為只要有利害關係,就有足夠的動機讓人丟開遊戲規則,而在這種地方,你又不能指望警察來維護規則——因為這套「規則」本身就是不合法的。說了這麼多,中心意思其實很簡單:如果你想利用概率,就必須先了解概率,清楚自己到底在做什麼,並確定自己的目標。最重要的是,如果贏的幾率小於1/2,就別以為長時間下來自己還會贏。即使是全然理性的決策也可能是錯的,因此,若結果出乎意外地糟,就沒有必要自責或自暴自棄;同樣地,如果運氣好,結果也不錯,也不必太沾沾自喜。要知道:概率就是概率,和老天是否眷顧毫無關係。啟示:誰也不滿足於自己的財產,誰都滿足於自己的聰明。——托爾斯泰第11章 股市:冤大頭遊戲一個繁榮的市場自然交易活躍,當然也就不可避免一些投機現象,但是如果投機盛行,成為市場的「規律」,那麼這個市場一定要出問題。股市是什麼要給股市下一個定義,並不十分容易。你當然可以花費一分鐘查一查詞典或百科全書上的解釋,但是查完之後,你的疑惑可能並不比知道這個概念之前少一些。正如很多人說的:股市是政策市、信息市、心理市,我們也可以說:是一個博弈市。通過購買企業的股票,人們投資於企業;企業拿這些投資去發展業務,當取得利潤的時候,要按照股份分紅給投資者。這就是股市投資的基本原理。但是,由於股票是可買賣、轉讓的,這個簡單的問題就變得複雜了。股票也成了一種特殊商品,有供給和需求矛盾造成的價格波動,股市又是一個完全競爭的效率市場,股價的活躍程度大大超過任何商品,這就使得很多人參與其中是為了博取差價,而「投資——分紅」的原始意義反而被忽略了。當然,有許多的市場形態(如期貨、外幣)都有類似「股票市場」的邏輯,透過某種公開競標的方式來購買替代性產品。所以,本章內容幾乎可適用於各式各樣的市場,不過一切都有個基本假設,就是這些市場都有公平的遊戲規則,當然,也不排除個別違規或是作弊的現象,這難以避免,只要不導致遊戲規則的破壞就沒關係。首先要探討的問題是,究竟有沒有可能根據決策理論找出最佳的投資策略。現在,已經有很多聲稱能為你帶來高額回報的股市分析軟體。不管對錯,一般人都相信分析股市的電腦程式能夠為他們帶來財富。就好像迷信的老太太相信老黃曆一樣。這種一窩蜂地把相同程式或運算方法一次又一次賣給個別投資人,很可能會抹煞掉市場的多樣性,而無法維持原來的公平與穩定性。一旦每個人用相同程式,不論好壞,在同一時間都會顯示相同買或賣的訊息:不管對錯,長此以往,定會造成市場混亂。這種情況經常發生,但一般人還是很容易忘記寫這些程式的人不比自己聰明多少,他們也只在銷售這類產品的行業里打滾罷了。在股市中,人們常常提到「莊家」——實際上,這類「莊家」是不合法的,但是幾乎沒有人否認他們的存在。有人認為,在股市賺錢的惟一辦法就是「跟庄」,因為他們常有渠道獲得內幕消息,這些信息是你我一般百姓所得不到的,而且,有時他們散布這類信息根本就是套散戶的陷阱。這裡我們將一起觀察股市的潮起潮落,並探究其背後的原因。當然,我們不是希望教會你如何炒股票(讀者也不要這樣指望),而是通過股市的一些現象,討論其中的博弈原則,這可能會使你加深對股票市場的理解。換言之,這裡不會告訴你該怎麼做,而是討論人們為什麼會這麼做。啟示:據說愛因斯坦死後進入天堂,上帝將他安排在一間4個人的房間里。愛因斯坦問第一個人智商是多少,那人回答為160。愛因斯坦喜出望外地說:「好!我正擔心來到這裡找不到探討相對論的夥伴呢。」他又問第二個人,那人的智商是120。愛因斯坦顯然有些失望,嘆了口氣說:「也好,我們還是能探討些數學問題。」他最後問第三個人,那人說他的智商不到80。愛因斯坦皺起了眉頭,良久之後說道:「看來我們只能侃侃股市了。」「大家發財」究竟發誰的財幾年前,美國著名經濟學家斯蒂格利茨教授曾在廣州中山大學做了「公共政策與東亞奇蹟」的演講。斯蒂格利茲教授在演講中特別談到股票市場。他告誡,股票市場當然重要,人們可以通過市場交易其股份和風險。但是在發達國家,股票市場並不是籌措資金用來投資的重要的場所。企業發行新股,應該是效益的負信號:效益最好的企業自有充足資金;次一等的企業,可以發行債券,按固定的利率付息。好的和比較好的企業,何必發行新股讓別人分享較高的利潤呢?在發達國家,就整個股票市場的總體而言,在過去的20年里,新股的發行遠遠趕不上企業購回現股的規模,因此,資本在股票市場是凈流出。在美國,新股減去回購對投資的比率是-9%。在其他發達國家,是-5%~-3%,籌資最多的日本也只有+2%。人們普遍認為,股票市場是一個重要的金融架構,但不是企業融資的主要來源。他不明白為什麼在中國人們對股票市場的期望那麼高。因為在美國,人們常說股票市場只是有錢人遊戲賭博的地方。股市投機、賭博的成分很大。在美國,股票市場只是「有閑+有錢」的人遊戲賭博的地方。至於廣大工薪階層、企業高層精英、大學專家教授,哪裡有那麼多時間緊跟股市行情的分秒變化呢?他們中的許多人也投資股票市場,都是我們這裡所說的股民,但他們做的主要是長線投資和基金投資。投機和長線投資不同,指的是頻繁轉手追求短期差價的股市行為。企業的股價變動,根本上應該是企業業績的反映。在短期內,企業是不可能創造很多利潤的。頻繁轉手追求短期差價,就像賭博一樣,沒有多少賺錢的機會,何況要負擔因為頻繁轉手變得沉重的交易費用和交易稅。所以發達國家成熟的股票市場,「長線投資多賺,投機短博多虧」是普遍的規律。「啤酒」與「泡沫」儘管我們很難把投資與投機截然分開,但是這兩種行為是有很大的差異的。發達國家的股票市場發育早,容量大,股市投資的觀念深入民心。股民在居民中的比例比我們高很多,但是卻完全看不到那種人頭涌動、盯住證券交易所股市行情屏幕的情況。因為他們做的主要是長線投資,而且絕大多數把資金交給共同基金的專業人員去投資,去管理,讓他們分享一些利潤,所以自己不必計較股票價格一時一刻的漲落。而中國股市還處於初創階段,投機成分很大。的確,在20世紀90年代初期,許多股民利用投機短博發了財,但那是因為我國股市還遠未成熟,尚處於初創階段,幾次股市泡沫讓他們沾了很大的光。但是隨著市場經濟的發展和股票市場的逐漸成熟,「長線多賺,短博多虧」終將成為規律。一位經濟學家曾打過一個有趣的比方,他說:股市就像一杯啤酒,如果沒有一點泡沫,說明它不新鮮(沒有活力);可是如果泡沫太多,啤酒就少了。事實上也是如此,一個繁榮的市場自然交易活躍,當然也就不可避免一些投機現象,但是如果投機盛行,成為市場的「規律」,那麼這個市場一定要出問題。因為說到底,支撐市場的是「啤酒」,而不是「泡沫」。回顧歷史我們也能看到,幾乎每一次「股災」前夕,都有一個「泡沫」沸反盈天的時期。無論是1929年席捲世界的經濟危機、1997年的東南亞金融危機、2000年的網路股引發的股市大跌,都是投機過盛、泡沫破滅的結果。除了別的教訓以外,它還使人們懂得,社會心理是金融市場的重要因素。對於為賣而買的股市投機行為,心理因素的影響就更大。在「行情好」的時候,人們都趨之若鶩;可是一旦行情轉壞,人們又惟恐逃得不快,這正是股市大漲大跌的原因。既然是股票市場,就不能排斥投機。但是短博多賺的階段終將過去。過去很少人做長線投資,這也不能全怪股民。例如,中國股市開放以來,迄今企業大多隻通過發行新股籌集資金,很少有企業把利潤拿出去按股分紅。人們看到的,要麼只是配股,要麼每股只分幾分錢。中國股市這種相當長時間沒有實質分紅的局面,是許多弊病的根源。啟示:一位股市上的風雲人物曾說過這樣一番話:「許多人認為我在股票生意中很成功,可是仔細計算下來,我才知道如果把在投機生意中所用的資本、時間和精力用在更正當的生意上,那麼我的財產可能會比現在更多。」「冤大頭理論」與「鬱金香狂熱」股票的原始意義在於:籌集資金用於生產以獲取利潤。然而現在買賣股票本身卻成了最可能賺錢的生意。擁有股權的人也許會身價百倍,所根據的不過是未來的期望。為賣而買的個別商品有一種奇怪的現象,就是如果大家都看好那種東西,一窩蜂你炒我炒,價錢可以炒到很高的位置,就會隨著所謂「冤大頭理論」繼續漲價。所謂「冤大頭理論」(也被稱做「博傻遊戲」)簡單說就是:如果某件商品的價格高於它的實際價值,你買下它,你就是「冤大頭」;可是只要還會有更大的「冤大頭」願意花更多錢來買,你這個「冤大頭」就值得當。金錢魔術的基礎就是「更大的冤大頭理論」——只要有這種人存在,價格就會繼續上升,大家都可以繼續賺下去。他們的資本家信念甚至相信無止境的增值,數目字繼續呈螺旋無限上升。為了讓財富的大乘法繼續下去,必須能增加無限的需要。在「冤大頭理論」盛行之時,股價可能被哄抬至荒謬的水平,然後重重地跌回現實當中。與歷史上一些投機泡沫破裂導致的價格大跌相比,我們正在經歷的股市低靡只不過是小意思。「每個時代都有其特有的愚蠢的事情。當制訂計劃、方案或編織幻想時,在受到利益的貪慾和尋求刺激的需求,或僅僅是受到模仿力量的驅使的情況下,就會有愚蠢的事情發生。一旦陷入到這些貪慾和需求中,愚蠢的事情就具有了瘋狂的野性……」以上引言出自《異常流行的幻想與芸芸眾生的瘋狂》,這本書是查爾斯·麥基於1841年寫的,然而至今仍在不斷再版。此書為何常盛不衰?就因為這世界的騙局和我們的愚蠢常盛不衰。在這本書中我們可以了解一些暴富者們傳奇般的故事。其中包括密西西比河和南海的「暴富」們不顧一切地大肆買賣荷蘭鬱金香。17世紀歐洲的鬱金香熱潮,就是個金融市場的群眾心理典型範例,麥基的書中介紹了當時對鬱金香的投資熱潮,一般人願意拿整年收入來購買一株花苞,每個人都有十足的把握,相信不管付出多少代價,一個月後就可用更高的價格賣出。在一個很短的時間裡,荷蘭的鬱金香球莖價格上升了好幾十倍,這股狂熱終因承受不了重擔而冰消瓦解,以更快的速度跌至原來的水平。這就像以空頭支票騙錢或匿名的連鎖信一樣,遲早會垮掉。現在許多詞典里都收錄了「鬱金香熱」這個詞,而現代的大眾傳播,人們更容易產生全面性的金融恐慌。前些年日本經濟泡沫現象嚴重,經濟增長不大,房地產卻在瘋炒,一時間,炒得僅東京地區的地產價值,簡直可以把整個美國買下。泡沫得太離譜了,一下子垮了下來,經濟損失當然很大,那些最後被套住的人就要虧大本。啟示:20幾年前中國北方也出現過類似事件——有位作家在他的作品中稱之為「瘋狂的君子蘭」。在當時職工月薪普遍不足100元的時候,卻可以炒到一株花標價十幾萬元人民幣。一時種花養花倒花成為熱潮,這股狂熱沒持續多長時間,卻使很多人傾家蕩產。傷兵的兩個瓶子在黑色幽默小說《第22條軍規》中,有一個「渾身纏滿繃帶的士兵」(誰也不知道他受了什麼傷,誰也沒見過繃帶下面的人,甚至誰也不知道繃帶下面到底有沒有人),他所得到的全部治療就是:上面掛一個瓶子輸液,下面放一個瓶子引流——然後兩個瓶子調換位置。我們都能看出這個故事的荒謬性,可是一旦它被應用於生活,很多人就忘了。任何金錢騙局的基本原理就是利誘:向某人借錢,許給他高額利息;再向其他人借,拿出一部分作為「利息」付給前一個人,以此類推,如果這種「生意」能持續下去,每個人都不吃虧。是不是?但這是不可能的,你欠的越多,償還的壓力越大。這是規模解決不了的問題。因為你能借到錢的人數不是無限的。這就是金融領域的「蓬齊」圈套,這一圈套的發明人是波士頓的蓬齊。1920年,他虛構了一家經濟實體,其實只是一個金字塔網路,不生產任何產品,拿後來投資者的錢支付前面投資者的利潤,在瘋狂的一段時間,撈到了幾百萬。「神秘鏈」的原理也差不多,它很簡單:積土成山。假如有1萬人參與這遊戲,每個人拿出1元錢所失甚微,可是如果這些錢都給一個人,那麼他就得到1萬元,這就是個大數目了。問題是,隨著參加遊戲的人數增多,是不是每個參與者都能拿到這麼一大筆錢呢?那是不可能的,部分不可能大於整體,無論參與者有多少,最終每個人的平均收入不可能大於支出。傳銷也是這個原理,不同的是,由於金錢總量中有一大部分要被組織者拿走(當然,他會給你一些「商品」作為回報),可供參與者分配的錢要小於他們的總支出。也就是說,這是一個必輸的遊戲。可是,不是有些人就是靠這個發財了嗎?沒錯,只是你要再想想:他的錢是誰的?是其他參與者的。一個人發財,意味著對無數人的盤剝。說到此,你是否發現我們的股市與上面的例子有點相似呢?幾年前,經濟界曾爆發了一場激烈爭論,爭論焦點是所謂「賭場論」,即中國股市是否已經成為了一個「賭場」?股市的過度投機,吸引了大量資金進入,造成了虛假繁榮的景象,可問題是股市是一個靠輸血維持的「中國病人」,自身造血機能很差——也就是說,發行股票的公司贏利狀況普遍不佳,無法創造大量財富支持股價的持續攀升。於是,有限資金就成了傷兵的兩個瓶子,掉來掉去,可並不增加。據估計,股市一路高漲是因為高達數千億的銀行資金悄悄流入股市,當政府開始調查時,這些資金匆忙撤出,於是股市一瀉千里,至今也沒恢復元氣。然而在公平市場,估算股票價值時應考量哪些要素?股票基本上只是一張紙,而且隨著電腦時代的來臨,股票已經成了看不見摸不著的「虛擬存在」,可能無數人都有過這樣的疑惑:假如整個證券交易所的電腦系統出了故障,拿什麼來證明自己持有哪些股票呢?股票代表著對某物業的部分擁有權,且有可能轉換成眼前或未來的所得,但隨著投資人眼光放得愈遠就愈不確定(當然還有適當的折現率),同時投資人還必須比較股權與其他投資工具的預期效益,如債券、銀行存款,房地產、連鎖速食店,或防盜工具等。有時候未來的預期值與股票本身關係不大,而與國內或世界總體經濟體制及前景有關,而這些考量會影響整體股票的受歡迎度、獲取價值及價格等方面的漲跌,而非個股本身的好壞與否。因此股價就由一堆確定與不確定的因素共同決定,而決定價格與價值兩者之間關係的這門學問就是所謂的「投資」。啟示:有這樣一個關於經濟學的笑話:在一個小島上,只有兩戶人家。小島資源匱乏,也沒什麼工作機會。可是這兩家人是怎麼活過來的呢?一家的女主人說:「我們是這麼乾的:我雇她給我洗衣服,她雇我給她洗衣服,這樣我們就都能掙到錢了。」說它是關於經濟學的,是因為它說明了一個道理:交易會帶來利益。說它是笑話,是因為在一個封閉環境里,僅僅靠交易並不能帶來利益的增加。「選美」與選股凱恩斯曾舉過一個「讀者選美」的例子說明人們選擇股票的策略。在所謂讀者選美比賽中,報紙刊登候選人的照片,而中選者要通過公眾投票產生,因為評選者要顧及自己的利益(比如,如果你的評選結果和最後的結果相同,你會獲得一筆獎金),他的投票就不可能以自己的愛好作為惟一標準,他還要考慮別人會如何投票。凱恩斯說:「專業投資大約可以比做報紙舉辦的比賽,這些比賽由讀者從100張照片當中選出6張最漂亮的面孔,誰的答案最接近全體讀者作為一個整體得出的平均答案,誰就能獲獎;因此,每個參加者必須挑選的並非他自己認為最漂亮的面孔,而是他認為最能吸引其他參加者注意力的面孔,這些其他參加者也正以同樣的方式考慮這個問題。現在要選的不是根據個人最佳判斷確定的真正最漂亮的面孔,甚至也不是一般人的意見認為的真正最漂亮的面孔。我們必須做出第三種選擇,即運用我們的智慧預計一般人的意見,認為一般人的意見應該是什麼……這與誰是最漂亮的女人無關。你關心的是怎樣預測其他人認為誰最漂亮,又或是其他人認為其他人認為誰最漂亮……」在報紙選美比賽中,讀者必須同時設身處地從其他讀者的角度思考。這時,他們選擇勝者與其說取決於真正的或絕對的美麗的標準,不如說是努力找出大家的期待是不是落在某個焦點之上。假如某個參加選美的女子比其他女子漂亮很多倍,她就可以成為這麼一個萬眾矚目的焦點。不過,讀者的工作就沒那麼簡單。假定這100個決賽選手簡直不相上下,最大的區別莫過於頭髮的顏色。在這100人當中,只1個紅頭髮的姑娘。你會不會挑選這位紅頭髮的姑娘?讀者的工作,是在缺乏溝通的情況下,確定人們究竟將會達成怎樣的共識。「選出最漂亮的姑娘」可能是書面規則,但這可比選出最苗條、頭髮最紅或兩隻門牙之間有一條有趣的縫隙的姑娘艱巨得多。任何可以將她們區別開來的東西,都可以成為一個焦點,使大家的意見得以會聚一處。出於這個理由,當我們發現當今世界最美麗的模特其實並不具備完美體態,我們就不會感到驚訝;實際上,她們只是近乎完美而已,卻都有一些有趣的瑕疵,這些瑕疵使她們各具特色,成為一個焦點。生活中有很多例子與這個模型是相同的。比如「十佳運動員」的評選,在這些投票過程中,對於每個投票者的激勵是:他如果「正確地」選中某些人,不僅要選中10個人,而且順序也要正確,那麼投票者將獲得某種獎勵。但是如何才能選中「正確的」人選呢?有「正確的」人選嗎?得票多的就是正確的嗎?或者嚴格地說,得票最多的是第一名(比如「十佳運動員」中的第一),得票次之的是第二名(如「十佳」運動員的第二名),等等。因此,投票者能夠選中的話,或者說被他提名的能夠「當選」的話,關鍵是猜測別人的想法,猜測對了你就能獲勝,猜測錯了,你則不能獲獎。在這裡,我們可以看到沒有正確與否,或者誰應該選上、誰不應該選上的問題,而是投票的人相互猜測的結果(當然,在這個過程中輿論的導向作用是很大的,它似乎告訴人們某某人是其他許多人所要選的)。股市投資具有一些類似的特點。每個投資者都希望賺錢,可是能否賺錢,不完全取決於某個股份公司的贏利情況,更要取決於其他投資者是否看好它。一個對股市不熟悉的人可能會以為:分紅最高的股票,其價格也最高。可是實際情況卻並不是這樣。凱恩斯的偉大之處,在於解釋了策略行動如何能在股市和報紙選美比賽中壓倒現情形,並確定誰是勝者。在股市中,一支股票若是在原有價格上的需求超過供給,也就是說,在某個價格上,想買進的比想賣出的多,其價格就會上升。要想在股市賺錢,你的目標是確定其他人認為哪幾支股票的價格就要上升。一直以來,他們都是通過同時設身處地從別人的角度考察這個問題得出自己的結論。只要他們確實這麼做,一切就會如常運行。這裡我們要說明的問題是,均衡可能輕易藉助莫名其妙的想法或一時興起的狂熱達成。沒有什麼基本原則可以保證最漂亮的參賽者會被選中,又或是最優秀的股票一定會最快升值。其中存在一些沿著正確方向移動的力量。預測的高回報就和選美比賽參賽者的膚色差不多,充其量並非充分的條件之一,這種條件可以用來制約局勢陷入莫名其妙的想法或一時興起的狂熱之中。啟示:股票是安全性最高的賭博,不但要有輸得起的氣魄,還要有賴于思考力與忍耐力的結合。「效率市場」,誰主沉浮由於公平市場的競爭相當激烈,而買賣雙方都得到相同的信息,因此雙方所共同同意的價格,就代表某支股票的市場價格,它表示雙方對該股票價值所展現的平均智慧,也代表個人根據手邊最充分的信息仔細分析判斷後,願意接受的價格。嚴格來說,市場價格不是一個平均數,而是在任何一個時間點,最想買的買方願意付給最想賣的賣方的價格。這就是專家所稱的「效率市場」。個人要奪得先機,他的信息必須比別人多或分析得更正確。簡單地說,效率市場背後的理論就是,市場上有許多人進行分析,所以任何會影響某支股票價格的因素或訊息都會立即散布,廣為人知,並化為眾人意識,且立即反映在股價上。有人會根據市場訊息採取行動,甚至因此獲益,有些實驗也證實,在這類環境中,新聞與謠言傳播得特別快。所以,在效率市場里,如果你的信息與競爭對手無異,分析工具也不見得特別高明,你就得比別人更聰明、更認真,才能表現得比別人更好。像股市中的傳奇人士彼得·林奇等,這些個別投資人能夠一年年地發達起來,就是因為他們比別人花更多的時間在閱讀和了解各個企業的狀況,所以的確能比其他人知道得更多,付出努力和技巧定會有回報,即使再投資也不例外。當然,在某些時候也會看到沒有特別努力或技巧的人還是可以表現不錯,不過,就像我們一直強調的,這只是運氣好而已!尤其在投資這一行,正常來說,「大師」這個頭銜只有一年的壽命,少有例外。另一條致富之道就是分析整體股市的統計資料,藉此找出未來趨勢,而這類分析師也可以避免挑選個股的辛勞與痛苦。這種做法當然比較模糊也複雜,不過還是可以試一試。首先必須找出平均股價,而非特殊的股票,不過到了最後,還是會繞回兩者之間。又見隨機漫步首先要問的是,到底造成每天平均股價變動的因素為何?有時,各式各樣的新聞會反映在股市上,並影響到未來投資景氣。有人曾說:格林斯潘的臉色好壞,就會影響股市的漲跌。這類影響當然可好可壞,跟能否事先預測到利率的調整有關:如果已有預警,則市場變化會受下列兩者的影響,即預期利率調高或調低,與投資人認為實際發生的可能性。如果一般人買賣股票或債券時已預期利率的變動,不管猜得對不對,都有助於市場效率。同樣的,戰爭、維持和平、政治事件等新聞都會影響市場的平均價格,如果你能比競爭者猜得更准,就可以因此獲利。每日市場平均的變動是由各種大大小小的因素所造成的,它們會影響到不同股票與投資,加起來就像賭場醉鬼隨機漫步的情況一樣。然而,究竟這些變動有多隨機?以紐約證交所一個普通交易日來看,大約有1000種個股紅盤作收,1000種個股走軟,另有700多種則維持平盤。如果這些漲跌變動真如習慣所稱的隨機,而個股變動也彼此獨立,那麼就可以採用平方根法則,以上漲與下跌個股支數的差約為1000,求其平方根,約等於30左右,與實際的40種相仿,屬合理範圍。因此,由這個粗略的案例,可看出個股漲跌就跟前面的那個醉鬼在斷崖邊漫步一樣,總和平均就像身處在千百個醉鬼的正中心一樣。類似分析的研究結論是股市每日平均變化的確很接近隨機漫步,皆幾乎找不到可辨識的模式,這也跟效率市場概念相當一致,認為應能找出某種可加利用的規律,如果它真的存在;而這種規律也會對價格結構產生足夠的影響力以自我補償。如果可以接受這個概念,應該明白想利用平均值找出這個規律,就像要猜出一群醉鬼下一步想怎麼走一樣。儘管為了這些分析,投資人已花下大筆金錢,塞滿了預言家的口袋,但因為證據仍是模稜兩可,因此投資大眾永遠存有希望,大師們與其他賭博性企業家才能飛黃騰達。不過人們也不必全知全能,就可以利用所知的一切獲得成功。再進一步往下探究,到底股市平均值日復一日的變動中,有多少是由隨機漫步的累積效果所造成的(別忘了,隨機漫步者在一段時間後,會從起始點向其他方向移動)。同樣也可以用平方根法則及同性質但較複雜的定理來加以分析,結果亦很具說服力,只是不夠清楚明白,那就是每日、每周、每月平均值的變動多因市場上個股隨機、互不協調的變動所造成,就像是醉鬼移動路線一樣。人們在認知上常犯的謬誤是無中生有,自以為可在無規律中看出規律、在無秩序中找到秩序。啟示:下面的一組試題可以測驗你承擔風險的能力:(1)你有足夠的收入應付家庭的基本需要嗎?(2)你有合適的人壽、健康保險嗎?(3)萬一你的主要收入中斷了,你是否有足夠的積蓄應付?(4)你是否擺脫得了繁重的財務負擔?(5)你若在股市中損失了部分錢,你承受得了嗎?巴菲特為什麼能賺錢根據最近的統計報告,世界首富依然是比爾·蓋茨,排名第二的就是巴菲特,他是惟一隻靠經營股票而躋身富翁排行榜前列的人。他在談他怎樣選擇理想股票時說:「我花了很多時間來研究沃特·迪斯尼公司。我最喜歡的公司是:美麗的城堡,周圍是一圈又深又險的護城河,裡面住著一位誠實而高貴的首領。最好有個神靈守護著這個城池。護城河就像一個強大的威懾,使得敵人不敢進攻。首領不斷地創造財富,但不獨佔它。換句話說,我們喜歡那種具有市場統治地位,別人難以模仿,耐久可靠的大公司。」他還說:「當我買股票時,我就認為是買下了整個公司,就像在街邊買了家商店。如果買下了商店,我就要了解它的一切。」因此,在網路股沸反盈天的時候,有人嘲笑巴菲特老了,他的投資思想已經過時,投資人也向他施加壓力,希望他也投入「淘金」熱潮。可巴菲特一直不為所動,他承認這些股票可能給投資者帶來巨大的利潤,但是他同時表示「不理解這些網路公司的贏利方式」。事過境遷,隨著網路泡沫的破滅,高高在上的網路股也土崩瓦解,「老了」的巴菲特再次笑到了最後。巴菲特這種充滿感情而又十分理智的炒股思想,使他在變幻莫測的股市始終把握著正確的方向,成為股市上一個著名的不倒翁。「股神」巴菲特曾經在美國華盛頓大學發表了以下這番談話:「我何以至此,不是智商問題,關鍵是理性。我一直視智商和天才如同發動機的馬力,但是輸出功率——發動機賴以運轉的效能——依賴於理性。許多人駕馭400馬力的發動機,但是只得到100馬力的輸出功率。更好的方式是用200馬力的發動機並使之輸出全部功率。」你也可以是「大師」好了,亂七八糟地談了一通股經,該回到「博弈」的正題上來了。如果你希望在股市上賺錢,就該先明確你的目的。你要的是紅利還是博取差價?如果是前者,你就該像巴菲特那樣,選擇合適的時機,找幾支值得投資的股票(如業績良好、安全可靠、市盈率低等)買下,然後就該幹什麼幹什麼;如果是後者,你就要明白,實際上你是要從別人腰包里掏錢,這可能與道德無關,但與策略大有關係。既然玩股票的大多輸錢,你就必須跟大多數人反著來。當然,這裡不是要告訴你應該在大家狂拋股票時逆流而上,我們說過,股市是個心理市,兵敗如山倒時企圖做「中流砥柱」只能被踩成肉餅。你應該比他們反應更快而不是更慢,別人瘋狂買進時你退出(一個在股市上賺了大錢的人是這樣「分析行情」的:當他發現營業大廳外停放的自行車超過一定數量時就賣出),市場一片低靡時進入,既然你就是要賺大家的錢,你就一定要先知道他們的玩法錯在什麼地方。「跑贏大市」(即自己的收益高於指數增長)其實並不如想像的那樣容易,即使在所謂「牛市」中,個股還是有的會漲,有的會跌。如果能比別人早一步得到內幕消息,就可因此獲利。用決策方法在股市使獲利極大化也非常複雜,且跟上述那些繁雜的統計脫離不了關係。所謂「快速上升通道」、「形態辨認」、「找出三上一下」等都不太管用,要從股價的過去走勢里看出點端倪有如找出天上白雲像什麼,人人都辦得到。另一方面,證據也顯示股市運作並不完全隨機,市場更非有絕對效率,所以投資就像本書提到的其他例子一樣,對努力和擁有充分信息的人相當有利,同時也讓懶惰與沒有信息的人遭受損失。也許無知者真的有福,但絕不是在賺取財富方面。有一位大主教曾呼籲信徒一定要永遠行在善惡間那條又直又窄的道路上,他指的是宗教信仰,不過這也正是破解股市的最佳方法。其實,也許惟一「理性」的投資方法就是巴菲特式,除此以外,真的沒有任何策略保證你只賺不賠。啟示:股票投資,沒有世襲的技巧,只有利用活錢的智慧。第12章 悖論:「交換信封」我們的知識體系、我們對世界的認識也許並不是建立在「惟一正確」的基礎上,而在這個基礎上建立起的認識世界的方式,既是一條道路,也是一個囚籠。悖論——邏輯的套索邏輯是有用的,也是有趣的,但這並不能保證它時時刻刻都讓你放心。邏輯是一切演繹推理的基礎。也許最有趣的就是像福爾摩斯那樣通過嚴密的推理,發現事情的真相。然而,有時你會發現,正是你似乎無懈可擊的推理和論證把你送進了死胡同。到底什麼錯了?是你的推理過程出了問題,還是邏輯本身隱伏著某種致命的缺陷?有個很有趣、很簡單的概念——悖論(也被譯作「弔詭」),簡單說就是自相矛盾的說法。即如果承認這個說法正確,就能推出這個說法不正確,反之,如果承認這個說法不正確,卻又能推出這個說法正確。至今仍令統計專家與決策理論學者爭論不休。你很聰明?很有邏輯頭腦?當有人這樣評價你時,你會感到高興。事實怎麼樣呢?想不想試試看?看看下面的幾個悖論吧!1.鱷魚和小孩的悖論鱷魚抓住了一個小孩,對他說:「我會不會吃掉你?你要答對了,我就放了你;答錯了,就吃了你。」小孩想了想,說:「你會吃掉我。」鱷魚懵了,它該怎麼辦呢?「我要是吃了你,你就說對了,我不該吃你;我要是不吃你,你又說錯了,我該吃了你……我暈!」小孩乘機跑了,鱷魚十分沮喪:媽的,他要說我會放了他就好了!2.《堂吉珂德》悖論《堂吉珂德》里描寫了一個國家,它有一條奇怪的法律:每個異鄉人到此都要回答一個問題:你來做什麼?你答對了,一切好說;你答錯了,就要被絞死。(當然,對錯是由人家說了算的)一個人回答:「我來是為了被絞死。」士兵像鱷魚一樣懵了:如果絞死他,他就對了,不該死;可是放了呢?他又錯了,該死。怎麼辦?到了國王那裡,他也想了好久,說:「無論怎麼做都不對,還是我法外開恩,放了他吧。」3.理髮師悖論理髮師悖論是由羅素提出的,羅素不但是哲學家,也是一位數學家,他提出這個悖論是為了說明數學中的集合問題。其大意是:某城裡有一個理髮師,他只給不肯自己刮臉的人刮臉,那麼,他給不給自己刮臉呢?你可能要爭辯:事實上,沒有鱷魚肯跟你講道理,沒有一個國家會通過這麼古怪的法律,也不會有一個針對理髮師的如此嚴格的規定……這些都是編造出來的。你是對的,在現實中,我們的確不大可能被這些難題困擾。但是對悖論的研究不是沒有意義的,更不是所謂「吃飽了撐的」。悖論不是存在於現實中,而是存在於我們對現實的認識和表述中,但這兩者不可能分開。如果沒有人類,世界仍然存在,但是卻沒有意義,意義正是人類認識的結果。博爾赫斯曾寫過一個令人著迷的小故事。在這個故事中,「我」得到了一把小石子,這些石子的特別之處在於:你每次數它們,數目都不同,這一次是3,下一次就可能是5或13。想想這個故事,想想故事中的疑問:如果畢達哥拉斯(古希臘數學家,在這裡代表人類的數學傳統)抓起的是這樣一把石子……這個故事暗示的是:我們的知識體系、我們對世界的認識也許並不是建立在「惟一正確」的基礎上,而在這個基礎上建立起的認知世界的方式,既是一條道路,也是一個囚籠。問題是,沒有人可以離開慣常的知識結構,只要他活著,就必須找幾條安身立命、為人處世的原則和方法,而他自己,也就被這些原則和方法規定起來。啟示:我們都不是生活在瘋人院里,邏輯思考能力是必須具備的。可是邏輯就像牛仔手裡的套索,弄不好也會把自己套住。艾畢曼德悖論理性的決策要靠邏輯,理性思考也不例外,悖論存在邏輯領域裡,主要是挑戰人類思考的協調一致性,以確定每個螺絲都配對了螺帽。如果兩個論述互相矛盾,就不會同時為真,就像擲一枚銅板,不會同時出現正面,又出現反面。所謂邏輯的內部一致性,就是指不論用什麼方法,都無法證明兩個敘述處於絕對對立的情況。如果想長智慧,解決自己明顯的內部不一致是不二法門。偉大的科學家愛因斯坦曾協助發現了量子力學的理論,但又自覺不完善,故在中年花了很長的時間想找個悖論以證明其不具一致性。愛因斯坦失敗了,量子力學到今天仍然存在,但當時悖論確實吸引許多物理界的精英投入研究。至今部分問題仍困擾著科學家們,而那些宣稱不感困惑的絕非專家。邏輯的悖論中有個最古老的、也不錯的例子,即艾畢曼德悖論,它是2500年前由一個克里特人艾畢曼德提出的。他宣稱:「所有的克里特人都是騙子。」這就是一個典型悖論。這句話究竟是真是假?如果是真的,那就不能相信說這句話的人,因為他自己就是克里特人,所以不可能為真。那麼,難道它是謊言?這麼一來,連這個人都是騙子,又怎麼能相信他的謊言和對克里特人的批評?再將這種想法延伸、擴展,大可在本書中插進一句話,請讀者不要相信書中的每一句話,當然也包括這一句在內,這是艾畢曼德悖論的延伸。著名的數學家哥德爾於1931年創造出革命性的定律。他指出,所有的數學體系都包含一些定律,無法證明,也無法推翻但這個定律並不是其中之一,因為他已做出了漂亮的證明。這個說法嚇壞了許多數學家,因為長久以來他們一直相信所有的數學定律都可以被證明是真或假,因此絕沒有任何問題。這種模稜兩可的情況造成極大的震撼,哥德爾用一個明確的例子來說明,並指出數學的深層意義。再回到艾畢曼德悖論。聰明的讀者可能會想:啊哈,這個狡猾的傢伙以為可以騙得到我,儘管這個理論已有2500年的歷史,但其實它是不存在的。因為艾畢曼德悖論說所有的克里特人都是騙子,這隻能證明說這句話的人本身是個騙子,卻不代表沒有誠實的克里特人存在,所以結論是這個人在說謊,是不是?沒錯,這的確是跳出這個古典悖論的方法。可是如果我們將它修改一下,假使那個人說的是:「這句話是謊言。」或者說:「我這個克里特人是個騙子。」這麼一來,就又繞回原來的困境,因為這兩句話有自我包容的特性,這也是該悖論的核心。或者,你也可以更進一步試試這麼兩句話——第一句說:第二句是假的,第二句說:第一句是真的。所以,原來的悖論設計得有點粗糙,但不影響其內涵。啟示:一個具有天才的人,必具有超人的性格,絕不遵循常人的思想和途徑。——司湯達別人的錢包總是更誘人還有一些悖論是關於人類心理的,比如中國有句俗話叫「這山望著那山高」,西方也有類似的話「鄰居的草坪總是比較綠」。可是,你是否知道這種心理也與博弈論有關?賭博必然存在的一個事實是:一人所得意味著另一人所失。因此,在參加一場賭博之前,非常重要的一點是從另一方的角度對這場賭博進行評估。理由在於,假如他們願意參加這場賭博,他們一定認為自己可以取勝,這就意味著他們一定認為你會輸。總有一個人說錯了,不過,這個人究竟是誰呢?其實,賭徒(這裡指的是誠實的賭徒)在一對一的賭博中對雙方概率的評估都還是理性的,他們承認這是可能贏、也可能輸的對等賭局(如果概率偏向一方,另一方一定不願參加),只不過他們認為自己的運氣一定比對方好罷了。下面將探討一個看起來對雙方似乎都有利的賭博,這是可能的嗎?如果不可能,那麼,問題究竟出在哪兒呢?一位教授和他的兩個學生——我們稱他們為「阿里」和「巴巴」——共進午餐,興之所至,教授提議「阿里」和「巴巴」玩一個遊戲:把他們的錢包交給他,他數了數,發現其中一個裝的錢正好是另一個的兩倍(但他沒有告訴他們誰多誰少),然後他問他們:在這種情況下,他們是否願意互換錢包?阿里當然知道自己的錢包里有多少錢,但不知道巴巴的,他想:對方要麼是我的1/2,要麼是我的2倍,如果是前者,那麼我損失了一半;如果是後者,那麼我增加了一倍,一倍的收益大於一半的損失,所以這個賭是划算的。巴巴也是這樣想,於是兩個人都願意打這個賭。現在我們用數字更詳細說明一下兩人的判斷:比如,阿里錢包里裝的是10元(於是他估計他要麼得到5元,要麼得到20元,前者損失了5元,後者得到10元,也就是說,在對等情況下,他的收益比損失多5元)。我們知道,如果你和某人玩猜硬幣,正面朝上輸1元,背面朝上贏2元,這個賭應該打,因為哪一面朝上的幾率相同,而收益大大多於損失,如果多玩幾次,你的所得肯定大於所失。只是恐怕沒有人願意和你這樣玩。這裡出了問題:既然沒有人願意打一個必輸的賭,那麼交換錢包為什麼卻是雙方自願的呢?雙方交換錢包,不可能使他們的結果都有所改善,因為用來分配的錢不可能交換一下就變多了。推理過程在哪出了錯呢?阿里和巴巴是否都應該提出交換呢?阿里或巴巴是否有一方應該提出交換呢?啟示:在密克羅尼西亞有這樣一則笑話:十年前,一個有錢人乘快艇到太平洋的小島上遊玩,島上的居民對他說:「你們有錢人真好,真羨慕你們!」而這位富翁卻回答說:「別開玩笑了,我才羨慕你們呢!我努力工作有錢,好不容易放假才可以來島上遊玩,哪像你們就住在這裡享受生活。」人們經常會陷入這種「這是理所當然」的錯覺中,從而變得更貪得無厭,羨慕別人。信息與理性假如阿里和巴巴都是理性的,而且估計對方也是這樣,那就永遠不會發生交換的事情。這一推理過程的問題在於它假設對方交換錢包的意願不會泄露任何信息。我們通過進一步考察一方對另一方思維過程的看法,就能解決這個問題。首先,我們從阿里的角度思考巴巴的思維過程。然後,我們從巴巴的角度想像阿里可能怎樣看待他。最後,我們回到阿里的角度,考察他怎樣看待巴巴怎樣看待對自己的看法。其實,這聽上去比實際情況複雜多了。可是從這個例子看,每一步都不難理解。假定阿里知道自己的錢包里有160元,多於一般水平(比如他裝這麼多錢是為了到飯館吃一頓大餐,或者要交納某項費用),在這種情況下,他知道他的數目比較大,而對方錢包里裝著320元的可能性很小,也就不願加入交換。既然阿里在160元的時候不願交換,巴巴應該在他80元的時候拒絕交換,因為阿里惟一願意跟他交換的前提是阿里只有40元,若是這種情況,巴巴一定更想保住自己原來的80元。不過,如果巴巴在80元的時候不願交換,那麼阿里就不該在40元的時候交換錢包,因為交換隻會在巴巴只有20元的前提下發生。如果雙方掌握了信息(一個人的錢包里一般情況下裝多少錢),就會作出理性的決策。可是這是否意味著這個悖論就此破滅了呢?換還是不換看來,問題的答案在這兩個人對「錢包里應該有多少錢」的常識性估計上,現在我們換一個故事,看看結果有什麼不同。現在有兩個人,「酷斃」與「帥呆」,正在花園裡一邊喝著酒,一邊討論關於精靈的神話。正好有個精靈從此經過,被他們的對話吸引,精靈認為在這個時代,還有人這樣仰慕和了解他們值得鼓勵,於是便決定給這兩個人一點獎賞。於是,他把一筆錢放入兩個信封,將信封分給「酷斃」與「帥呆」,出於喜歡惡作劇的個性,精靈透露,這兩個信封里金額不同,其中一個是另一個的兩倍,但他沒有說哪個多哪個少。然後精靈隨著一縷輕煙消失無蹤。在精靈消失後,兩個人拆開信封,偷看自己拿到的那筆錢,同時心裡忖度著,自己到底拿到多的那份?還是少的?「酷斃」心想:這是筆意外之財,我拿到的數額已經很不錯了,如果這是多的那份,「帥呆」就只有我的一半;不過,他也可能很走運,拿到我的兩倍。再回顧整個過程,精靈是先把錢裝好,密封之後才隨機發給我們,因此這是一個對等賭局,兩人拿到大份的幾率是一半一半。所以也許我應該跟「帥呆」談個交易,互相交換。既然我贏得一倍金額和損失一半金額的幾率都是50%,則仍有期待凈利參照上面故事的邏輯。根據決策原則,「酷斃」認為這對他相當有利,便決定和「帥呆」交換。即使「酷斃」沒有拆開信封也可以作出相同決定,因為支票的面額並不影響整個思考邏輯。「帥呆」以同樣的方式思考後,也認為與「酷斃」進行交易對自己較有利,於是當「酷斃」一提出交換的建議,「帥呆」馬上欣然允諾。兩人的情況完全一樣,都認為自己能遵從一定的邏輯推理規範。那麼,有沒有可能兩人同時都是對的呢?畢竟這是個零和遊戲,「酷斃」贏就等於「帥呆」輸,反之亦然,既然不能雙贏,就一定有人是錯的。但這兩人不都是經過縝密邏輯思考了嗎?在競賽中,雙方都認為自己會贏,這在邏輯上當然站得住腳,在運動場上、戀愛或戰爭的情境里也都很常見。但在這個例子里,競賽雙方都很理性,這也就是悖論的所在。邏輯中隱藏陷阱你可能會問:這兩個故事不是一樣嗎,何必要再講一遍?真的一樣嗎?想一想前面的例子是如何解決的?「救命稻草」是我們的生活經驗,可是在這個例子里,沒有這根「稻草」:別忘了,「酷斃」和「帥呆」對精靈的財富總量和慷慨程度完全沒有概念,兩人惟一的信息是自己手中信封的金額。這正是與前面的故事的不同之處。誰也不知道精靈到底有多少錢,以及到底有多慷慨。即使你拿到了1個億,你也不知道到手的是不是多的那一份!「酷斃」和「帥呆」兩人都犯了一個首要的錯誤,以為中大獎的幾率在拆開信封以前或之後完全沒有兩樣。由於精靈在分信之前充分洗過牌,因此兩人在拆開信封前得大獎的幾率確實是一半一半,但當兩人看過內容後,實在沒有道理假設他們仍認為自己拿到小額支票的幾率還是50%。這麼說吧,不論精靈的獎金是多少,l000元也好,10億元也罷,他先把獎金分成不等的兩份,再充分洗過,「酷斃」拿到任何一個信封的機會都是50%,到此都沒有問題。不過在兩人拆開信封查看後,情況就完全改觀。所以如果「酷斃」打開信封並發現自己拿到10萬元,就可以推論總獎金只有兩種可能:如果「帥呆」拿到5萬,總數就是15萬;如果「帥呆」拿到20萬,總數就是30萬,而他分到小包的。因此,「酷斃」要算的幾率不是究竟自己拿到的是大包還是小包在信封發放前,機會應該是一半一半,而是究竟精靈給的是15萬還是30萬,這可就是完全不同的選擇了。「酷斃」不應該還相信兩者出現幾率各是50%。如果他認為精靈的財力或慷慨程度有限,那麼他應該設想最壞的狀況:精靈給的是15萬,自己已得到較大筆的獎金,所以不該交換,這個結論跟他一開始的想法正好相反。當然,「酷斃」也可以假設精靈非常富有,送出個15萬、30萬根本不算什麼。因此,兩種情況都有可能,所以結論和先前想法一致,他應該交換。重點是「酷斃」不能不顧手中拿的是百萬還是更多,而做相同的假設,因為這裡談的是幾率,它的基本原則為所有可能選擇方案的幾率值加起來一定要等於l,不論是「酷斃」、「帥呆」,還是精靈都不能改變這一點。所以不論金額多少,假設幾率都一樣,則其加總結果絕不會等於l。因此,「酷斃」和「帥呆」如果要作出理性決策,就必須估計精靈的財富到底有多少、獎金總額又有多高:而誰根據手中的金額把獎金總額估算得越精確,就越可能作出是否交換的最佳決策。至於手中拿到小額獎金的人會比較傾向交換,這本來就是很合理的。這裡要說明的是:談概率時一定要弄清楚比較的選擇方案究竟是什麼。在「酷斃」、「帥呆」拿到信封前,他們拿到大額獎金的幾率確實是各半,一旦信封發下來,原來的方案就消失,這時再談既定事物的概率完全沒有意義,也就是概率會隨事件的發展、選擇的改變或消失等而有所不同:在信封發下來後,應該考慮的方案就不再是誰拿到哪一個,而是精靈究竟給了多少。一般人很容易把一組選擇方案的事前概率誤以為是其他方案的事後概率,兩者根本風馬牛不相及。就像賽馬開閘後,馬匹風馳電掣向終點進發,這時下注站絕對不會允許你加註。這實在太明顯,但它卻是本章的「悖論」根源所在。啟示:每個問題都隱藏著解決其自身問題的線索。如果對問題的探討足夠深入,就能夠找到解決的方法。「獎懲分明」但其中一人是否能完全猜對呢?大概不能吧,因為他們對精靈的銀行存款及慷慨程度了解有限。但有什麼關係?就像現實生活里,猜得愈準的人,決策就做得愈好。如果你不想把希望寄托在老天開恩上面,智慧是救不了你的,你只有依靠情感這個朋友了。現在,我們把問題修改一下:假如「酷斃」與「帥呆」正在說褻瀆神靈的話,被精靈聽到,於是勃然大怒,要給他們以懲罰。於是精靈寫下兩個數字,一個是另一個的兩倍,誰抽到其中一個,就要挨上相同數目的鞭子。在這種情況下,兩個人還要不要交換呢?你會發現,這次兩個人的選擇完全不同了。「酷斃」發現自己抽到的是100,他當然巴不得換來一個50,可是他想:假如「帥呆」抽到的是200,這麼一交換就要多挨100鞭,而最好的結果不過是少挨50鞭,權衡利弊,還是不要換了,老實挨這100鞭吧。「帥呆」也會這樣想,所以誰也不願交換,即使交換肯定對其中一人有利。由此我們看到,在獲得利益時,人們願意承擔某些風險;但是在付出代價時,人們就傾向於迴避風險。「酷斃」可能想到「知足常樂」的古訓,只要他相信自己不至於被打得沒了命,他就不會去交換。換到獎勵的情況也是如此,理性的選擇是:如果你對是否交換感到猶豫,你就不該交換。這個結論確實不令人滿意,因為它不能從邏輯上告訴你怎樣做才正確。在理智的盡頭,能幫助我們的只有「知足常樂」之類的情感和直覺。人往往是這樣,到手的東西總不那麼叫人滿意。但是知道「適可而止」總不是壞事。有句話說的是「孩子是自己的好,老婆是別人的好」,倒是對這一悖論的極好詮釋。可是即使老婆真是別人的好,在「交換」之前,你也要三思,畢竟這個「不如別人」的老婆有個「別人不如」的孩子。「破窗理論」我們說過,悖論只存在於邏輯中,現實中不大會出現。但是有些社會現象還是很有悖論色彩的。比如有這樣一種經濟學理論,一方面聲名狼藉,另一方面卻又常常被人這樣那樣地運用,這就是「破窗理論」。法國19世紀著名經濟學家巴斯夏提出了「破窗理論」(但他本人並不支持這個理論,相反,他總結它正是為了批判):一個小痞子砸碎了理髮店玻璃窗,這一惡行對社會造成了破壞,但是理髮師的不幸卻是社會的福音,它將為玻璃生產商製造出商機,生產商拿到錢後又去購買其他生產商的產品……這樣算來,他給社會造成的損害只是一次性的(只打碎那幾塊玻璃),可是他給社會帶來的機會卻是連鎖性的(玻璃生產商、原料供應商、挖沙人、運輸者……都得到了工作)。結論是:打碎一塊玻璃,提供了無數金錢和就業機會,得大於失。用前面的例子說,這個交換很「划算」。因此,不良少年是社會的恩人,而不是罪犯。大多數人都能指出其荒謬之處,如果破壞他人財物是好事,那麼我們為什麼還要懲治這類犯罪呢?倒是應該給他們獎勵才是。如果那樣,這個世界將亂成什麼樣子?而且,理髮師的窗戶被打碎了,他需要安裝一扇新的窗戶,他要動用一筆額外的費用。這筆費用本來可能是打算購買衣服的。但是新的窗戶代替了衣服,也就是說玻璃生產商得到的正是裁縫所失去的。社會凈福利依然沒有什麼增加,不良少年依然是危險分子。但是,很多人(包括很多經濟學家)卻信奉經過變形的「破窗理論」,比如我們都聽過關於「假日經濟」(節日放長假可以拉動GDP上升百分之幾)、「洪水經濟」(發洪水有利於擴大內需)之類高論,就連美國出了「9·11」事件,也有人認為,這有可能成為拉動美國(甚至全球)經濟復甦的機會。「破窗理論」的謬誤,根源在於不知道「資源是稀缺的」,在一個地方沒有必要地消耗資源,在另一個地方就要鬧資源短缺。你把全世界的窗戶都砸掉,做玻璃的當然是發財了,可做衣服的卻都餓死了。做玻璃的沒有衣服穿,早晚也得凍死。況且,做衣服的不買糧食,食品店老闆沒有生意做,種地的農民也賣不出糧食,所以也沒錢買別的……換言之,你不能計算收益時用「連鎖性」,而計算成本時就忘了這一點。啟示:用一句話簡單總結「破窗理論」的「精髓」,那就是「壞事變好事」。如曼德維爾在《蜜蜂的傳說》中宣稱的那樣:個人的惡行對公眾來說是一種美德。奢侈腐化的社會享受極大的繁榮,而勤儉的社會將飽受經濟蕭條的折磨,結論是「純粹的美德不能為國家帶來繁榮」。藏羚羊與毒品珍稀動物保護問題也遇到一個難解的矛盾。如藏羚羊被捕殺,是因為「懷璧其罪」:藏羚羊毛在法語中被稱為「莎圖什」,意為「戒指披肩」——因為一條藏羚羊毛披肩可以從指環中穿過,如此柔順輕暖,是製作高檔毛織物的理想材料。如此珍稀的資源,當然禁不起物慾橫流的消耗,藏羚羊的生存岌岌可危。政府禁止獵殺,嚴懲盜獵者,當然是正確之舉。可是這又引起了一個新麻煩:抬高了藏羚羊毛價格(還記得《大腕》中的名言嗎:「能出2000美金的主兒,就不在乎出4000美金。」而且,4000美金反而更能顯示其身價),使盜獵成了「高風險、高收益」的生意,於是,更多的亡命之徒加入盜獵者的行列。怎麼辦?允許隨便捕殺肯定不是辦法:沒等價格下來,藏羚羊就被打光了。人工飼養理論上似乎可以,但是技術上未必可行,而且,一旦允許藏羚羊交易,野生飼養又很難分辨,可憐的野生藏羚羊還是要被捕殺。這真是一個難以解決的問題。還有一個例子是麻醉品(毒品)問題。毒品之害,人所公認,可是在荷蘭等國家,買賣輕度麻醉品卻是合法的。很多學者,包括兩位諾貝爾經濟學獎得主弗里德曼和貝克爾,也都公開支持麻醉品合法化。他們的理由如下:第一,我們缺乏道德上的理由,去懲罰那些自殺的人。既然如此,對那些自願用麻醉品慢性自殺的人,我們又有什麼理由去懲罰他們呢?我們當然可以用言語來勸說,但我們沒有權利阻止和懲罰他們。第二,麻醉品合法化後,「自願」食用麻醉品的人數可能會上升,也可能會下降,但「被迫」食用麻醉品的人數肯定會下降。要知道,現在很多癮君子都是受害人,他們是因為上當受騙而成為癮君子的,在麻醉品非法的情況下,癮君子無法通過正當的途徑獲取麻醉品,犯罪分子於是產生強烈的動機,要誘騙別人上癮,通過麻醉品盤剝別人的財富。當麻醉品非法時,只有社會上的惡棍才敢鋌而走險去販賣,並惡意地拉人下水;當它合法時,正當的商人也會去販賣,但不會強加於人。第三,由於麻醉品只能在地下買賣,所以品質得不到保證,癮君子的身體會受到更嚴重的損害。第四,管制之下,麻醉品的價格極高,這會誘使癮君子從事其他犯罪活動。一旦放開管制,麻醉品的價格就會暴跌,原來靠販賣麻醉品牟取暴利的黑社會分子,會一下子失去了賴以為生的溫床,而癮君子從事其他犯罪活動的機會也會減少。這些論證的確有些「驚世駭俗」,也未必真正實行得了,但是想一想,你也會承認有一些道理。我們都知道「兩害相權取其輕」,可問題是有時候我們真的弄不清孰輕孰重。說到這裡,我們就不得不對「人類理性」做一番思考了:理性當然是不可缺少的,但是它是否能夠「包打天下」呢?在下一章,我們將討論這個問題。啟示:許多年以前,美國重量級拳王吉姆在例行訓練途中看見一個漁夫在打漁時總是將大魚放回去,只留下小魚。吉姆好奇地問那個漁夫原因。漁夫答道:「老天,我真不願意這樣做,但我實在別無選擇,因為我只有一口小鍋。」許多時候,我們每個人都會面臨這樣的兩難境地。第13章 理性與非理性經濟學建立在兩個假設前提上,其一,人是自私的,都在追求利益的最大化;其二,人是理性的,其所有行為都是為了實現追求利益最大化這個目的。換言之,人不但知道自己的利益所在,而且知道該如何去追求。理性的困境經濟學建立在兩個假設前提上:其一,人是自私的,都在追求利益的最大化;其二,人是理性的,其所有行為都是為了實現追求利益最大化這個目的。換言之,人不但知道自己的利益何在,而且知道該如何去追求。他可以「損人利己」,也可能「利人利己」,但並不會去「損己利人」、「損人損己」和「損人不利己」。這裡有兩個疑問,一個涉及道德,即如何解釋某些「毫不利己,專門利人」的高尚行為;另一個涉及理性,在現實中,我們都見到過「損人損己」和「損人不利己」的行為,又該如何解釋?道德問題我們會在稍後討論,這裡主要探討人類的理性問題:人是否聰明到了知道自己利益所在,並知道追求利益的正確途徑?有這樣一個博弈:兩人分一筆總數固定的錢,比如100元。方法是:一人提出方案,另外一人表決,如果表決的人同意,那麼就按提出的方案來分,如果不同意的話,兩人將一無所得。比如A提方案,B表決,假如A提的方案是70:30,如果B接受,則A得70元,B得30元;如果B不同意,則兩人將什麼都得不到。你也許要懷疑這種情況完全是虛構出來的,沒有什麼現實意義,其實並不如此。在現實中,這種情況有可能出現。比如,一個賓館服務員撿到了100元,他想據為己有;可是另一個服務員看到了,於是威脅如果不分給他一部分,他就要向領班報告,在那種情況下,這筆錢就要上繳,誰也得不到。你可能又要說,這兩個人的境界太低。需要再次申明,這裡探討的是理性(即「合理自私」)問題,而不是道德問題。A提方案時要猜測B的反應,A會這樣想:根據「理性人」的假定,A無論提出什麼方案給B——除了將所有100元留給自己而一點不給B這樣極端的情況,B只有接受,因為B接受了還有所得,而不接受將一無所獲——當然此時A也將一無所獲。此時理性的A的方案可以是:留給B一點點比如1分錢,而將99.99元歸為己有,即方案是:99.99:0.01。B接受了還會有0.01元,而不接受將什麼也沒有。這是根據理性人的假定的結果,而實際則不是這個結果。英國博弈論專家賓謨做了實驗,發現提方案者傾向於提50:50,而接受者會傾向於:如果給他的少於30%他將拒絕,多於30%則不拒絕。這個博弈反映的是,「人是理性的」這樣的假定在某些時候存在著與實際不符的情況。啟示:大多數道德實際上有利己成分,或者從長遠說,是「利人利己」的。某些自我犧牲的行為雖然存在著,但並不普遍,且不足以動搖人類的行為趨向。要買一張彩票嗎理論的假定與實際不符的另外一個例子是「彩票問題」。我們說理性的人是力圖使自己的效益最大,如果在信息不完全的情況下則是使自己的期望效益最大。但是這難以解釋現實中人們購買彩票的現象。人們願意掏少量的錢去買彩票,如福利彩票、體育彩票等,以博取高額的回報。在這樣的過程中,人們自己的選擇理性發揮不出來,而惟有靠運氣。在這個博弈中,人們要在決定購買彩票還是不買彩票之間進行選擇。根據理性人的假定,選擇不買彩票是理性的,而選擇買彩票是不理性的。因為彩票的命中率肯定低,並且命中率與命中所得相乘肯定低於購買的付出(如你花費2元買一張彩票,假定最高獎金是100萬元,中獎概率是百萬分之一,你其實已經虧了),因為彩票的發行者早已計算過了,他們通過發行彩票將獲得高額回報,他們肯定贏。在這樣的博弈中,彩票購買者是「不理性的」:他未使自己的期望效益最大。但在社會上有各種各樣的彩票存在,也有大量的人來購買。可見,理性人的假定是不符合實際情況的。當然我們可以給出這樣一個解釋:現實中人的理性的計算能力往往用在不符合實際情況的「高效用」同題上,而在「低效用」問題上,理性往往失去作用,對於人,存在著「低效用區的決策陷阱」。在購買彩票問題上,付出少量的金錢給購買者帶來的損失不大,損失的效用幾乎為零,而所能命中的期望也幾乎是零,這時候,影響人抉擇的是非理性的因素。比如,考慮到如果自己運氣好的話,可以獲得高回報,這樣可以給自己帶來更大的效用,等等。彩票發行者正是利用人存在著「低效用區的決策陷阱」而尋求保證賺錢的獲利途徑。「旅行者困境」即使是二人同時決策,博弈論也為我們提供了警示世人別太「聰明」的例子:兩個旅行者從一個以出產細瓷花瓶著名的地方旅行回來,他們都買了花瓶。提取行李的時候,發現花瓶被摔壞了。他們向航空公司索賠。航空公司知道花瓶的價格總在八九十元的價位浮動,但是不知道兩位旅客買的時候的確切價格是多少。於是,航空公司請兩位旅客在100元以內自己寫下花瓶的價格。如果兩人寫的一樣,航空公司將認為他們講真話,於是按照他們寫的數額賠償;如果兩人寫的不一樣,航空公司就論定寫得低的旅客講的是真話,並且原則上照這個低的價格賠償,但是對講真話的旅客獎勵2元錢,對講假話的旅客罰款2元。就為了獲取最大賠償而言,本來甲乙雙方最好的策略,就是都寫100元,這樣兩人都能夠獲賠100元。可是不,甲很聰明,他想:如果我少寫l元變成99元,而乙會寫100元,這樣我將得到101元。何樂而不為?所以他準備寫99元。可是乙更加聰明,他算計到甲要算計他寫99元,「人不犯我,我不犯人,人若犯我,我必犯人」,他準備寫98元。想不到甲還要更聰明一個層次,計算出乙要這樣寫98元來坑他,「來而不往非禮也」,他準備寫97元……大家知道,下象棋的時候,不是說要多「看」幾步嗎,「看」得越遠,勝算越大。你多看兩步,我比你更強多看三步,你多看四步,我比你更老謀深算多看五步。在花瓶索賠的例子中,如果兩個人都「徹底理性」,都能看透十幾步甚至幾十步上百步,那麼上面那樣「精明比賽」的結果,最後落到每個人都只寫一兩元的田地。事實上,在徹底理性的假設之下,這個博弈惟一的納什均衡,是兩人都寫0。這就是哈佛大學巴羅教授提出的著名的「旅行者困境」。一方面,它有啟示人們在為私利考慮的時候不要太「精明」,告誡人們精明不等於高明,太精明往往會壞事;但是另一方面,它對於理性行為假設的適用性提出了警告。有了這個假設,我們就可以按照這個明確的比較取捨標準來推理,但是推斷出來的結論是否符合實際,依賴於應用「理性行為」假設的程度。如果你的論證像「旅行者困境」那樣,假設當事人徹底理性,能夠算計到十幾步甚至幾十步,那麼你推論出的結果,未必符合現實。大家知道,理性行為假設是討論消費者和企業這些經濟主體人的行為的基本假設。所以經濟學在理性行為假設之下得到的結論是否符合實際,還要進行另外的分析。在這個意義上,「旅行者困境」是所有博弈論學者甚至所有經濟學者必須面對的困境。啟示:一位富翁的狗在散步時跑丟了,於是他急匆匆地在電視台發了一則啟事:有狗丟失,歸還者付酬金1萬元。並有小狗的一張彩照,充滿大半個屏幕。一位乞丐看到廣告後,第二天一大早就抱著狗準備去領酬金。當他經過一家大百貨商場的牆體屏幕時,又看到了那則啟事,不過賞金已變成3萬元。乞丐又折回他的住處,把狗重新拴在那兒,在接下來的幾天時間裡,乞丐從沒有離開過這隻大屏幕,當酬金漲到使全城市民都感到驚訝時,乞丐返回他的住處,可是那隻狗已經死了——在這個世界上,金錢一旦被作為某種籌碼,就不會再買到任何東西。強盜分贓如果你對自己的頭腦很有自信,來看看這個問題:有五個強盜搶得100枚金幣,在如何分贓問題上爭吵不休。於是他們決定:(1)抽籤決定各人的號碼(1,2,3,4,5);(2)由1號提出分配方案,然後5人表決,如果方案超過半數同意就被通過,否則他將被扔進大海喂鯊魚;(3)1號死後,由2號提方案,4人表決,當且僅當超過半數同意時方案通過,否則2號同樣被扔進大海;(4)依次類推,直到找到一個每個人都接受的方案(當然,如果只剩下5號,他當然接受一人獨吞的結果)。假定每個強盜都是經濟學假設的「理性人」,都能很理智地判斷得失,作出選擇。為了避免不必要的爭執,我們還假定每個判決都能順利執行。那麼,如果你是第一個強盜,你該如何提出分配方案才能夠使自己的收益最大化?據說,凡在20分鐘內答出此題的人有望在美國賺取8萬美元以上的年薪,還有人乾脆說這其實就是微軟員工的入門測試題。希望拿到年薪8萬美元或者進入微軟的大有人在,你可能也是其中之一,如果是這樣,你不妨先停下來,花上20分鐘,好好做做這道題。如果你沒有這份耐心,就接著往下看。出乎意料的答案這道題十分複雜,很多人的答案都是錯的。為了敘述方便,我們先公布答案,然後再做分析。這個嚴酷的規定給人的第一印象是:如果自己抽到了1號,那將是一件不幸的事。因為作為頭一個提出方案的人,僅僅能活下來的機會都微乎其微。即使他自己一分不要,把錢全部送給另外4人,那些人可能也不贊同他的分配方案,那麼他只有死路一條。如果你也這樣想,那麼答案會大大出乎你意料。許多人公認的標準答案是:1號強盜分給3號1枚金幣,4號或5號強盜2枚,獨得97枚。分配方案可寫成(97,0,1,2,0)或(97,0,1,0,2)。只要你沒被嚇壞,你就可能站在這四人的角度分析:顯然,5號是最不合作的,因為他沒有被扔下海的風險,從直覺上說,每扔下去一個,潛在的對手就少一個;4號正好相反,他生存的機會完全取決於前面還有人活著,因此此人似乎值得爭取;3號對前兩個的命運完全不同情,他只需要4號支持就可以了;2號則需要3票才能活,那麼,你……思路對頭,但是太籠統了,不要忘了我們的假設前提:每個人都十足理性,都不可能犯邏輯錯誤。所以,你應該按照嚴格的邏輯思維去推想他們的決定。從哪兒開始呢?前面我們提過「向前展望,倒後推理」,推理過程應該是從後向前,因為越往後策略越容易看清。5號不用說了,他的策略最簡單:巴不得把所有人都送去喂鯊魚(但要注意:這並不意味著他要對每個人投反對票,他也要考慮其他人方案通過的情況)。來看4號:如果1~3號強盜都餵了鯊魚,只剩4號和5號的話,5號一定投反對票讓4號喂鯊魚,以獨吞全部金幣。所以,4號惟有支持3號才能保命。3號知道這個策略,就會提(100,0,0)的分配方案,對4號、5號一毛不拔而將全部金幣歸為己有,因為他知道4號一無所獲但還是會投贊成票,再加上自己一票他的方案即可通過。不過,2號推知到3號的方案,就會提出(98,0,l,1)的方案,即放棄3號,而給予4號和5號各1枚金幣。由於該方案對於4號和5號來說比在3號分配時更為有利,他們將支持他而不希望他出局而由3號來分配。這樣,2號將拿走98枚金幣。不過,2號的方案會被l號所洞悉,l號並將提出(97,0,1,2,0)或(97,0,1,0,2)的方案,即放棄2號,而給3號1枚金幣,同時給4號或5號2枚金幣。由於l號的這一方案對於3號和4號(或5號)來說,相比2號分配時更優,他們將投l號的贊成票,再加上1號自己的票,1號的方案可獲通過,97枚金幣可輕鬆落入腰包。這無疑是1號能夠獲取最大收益的方案了!難以置信,是不是?難道上面的推理真是毫無破綻嗎?應該說,還真有一個模糊不清之處:其實,除了無條件支持3號之外,4號還有一個策略(這是許多專家都沒有考慮到的):那就是提出(0,100)的方案,讓5號獨吞金幣,換取自己的活命。如果這個可能成立的話(不要忘了「完全理性」的假定,既然可以得到所有錢,5號其實並不必殺死4號),那麼3號前面的策略就顯然失敗了,4號如果一文不得,他就有可能投票反對3號,讓他喂鯊魚。你可能要反對:作為理性人,4號幹嗎要做「損人不利己」的事呢?而且,這多少還要冒可能被扔下海的風險?是呀,有道理。可是,如果大家都是理性人,5號在得錢後可以不殺死4號,那麼對4號來說,投票贊成和投票反對3號都是一樣的,也就是說,無論他怎麼選擇都可以。3號當然不應該把希望寄托在4號的隨機選擇上。如果我們允許有一點點「非理性」存在,即5號還是可能在不必要的情況下殺死4號,那麼4號是不該冒這個風險;可是同理,3號也不該冒沒有必要的風險。無論是哪種情況,他都應該給4號1枚金幣,使其得到甜頭,支持自己。這樣他的「保險方案」就是(99,1,0);相應地,2號的方案也要修改一點,比3號多給4號1枚,使其支持自己,也就是(97,0,2,1)。對於1號來說,倒是不必多掏錢,而是減少了兩枚金幣收買4號這一種可能性,也就是說,前面所說的「標準答案」只剩下了一種,即(97,0,1,0,2)。當然,他也可以選(96,0,1,3,0),但是由於收買4號要比收買5號多花1枚金幣,所以也就算不上「最佳」方案了。啟示:人們心中總認為金錢是萬能的,能獲得安全感,能帶來感情,甚至可以改造一切,所以,人們無所不用地追逐致富的公式。然而,這種貪念卻常超過主觀的需要與客觀的供給。當然,結果總未必盡如人意。「先發優勢」和「後發優勢」在研究博弈理論的人看來,「強盜分金」其實是一個高度簡化和抽象的模型(非數理模型),但無疑以現實為基礎。在「強盜分金」模型中,任何「分配者」想讓自己的方案獲得通過的關鍵是事先考慮清楚「挑戰者」的分配方案是什麼,並用最小的代價獲取最大收益,拉攏「挑戰者」分配方案中最不得意的人們。想一想歷朝歷代的農民起義,想一想綿延不斷的宮廷鬥爭,想一想今天生活中存在的結盟與背叛,想一想企業內部的明爭暗鬥,想一想辦公室腳下使絆的政治,哪一個得勝者不是採用類似「強盜分金」的辦法?還可以舉出許許多多的例證來。比如,在國際政治、經濟中,各國的地位是不平等的,存在著「先發」和「後發」的區別,正如這個遊戲中每個人的順序。1號看起來最有可能喂鯊魚,但他牢牢地把握住先發優勢,結果不但消除了死亡威脅,還收益最大。這不正是全球化過程中先進國家先發優勢嗎?而5號看起來最安全,甚至還能坐收漁人之利。卻因不得不看別人臉色行事而只能分得一小杯羹。這難道不是後發劣勢的寫照?可以預料,如果中國人總是處於5號位置,總是坐等別人制定規則,就無法避免「看人臉色」的不利處境。啟示:有兩句似乎矛盾的成語:先發制人和後發制人。與此相對應的是所謂「先發優勢」和「後發優勢」。所謂「先發優勢」是指一步領先,步步領先的「馬太效應」;而「後發優勢」是指可以在前人發展的基礎上發展,而不必付出探索的成本和代價。都是理性惹的禍「強盜分金」模型雖然是一個有益的智力測驗,但應用於現實仍顯粗糙不堪,與現實世界的精緻模型相比要遠為複雜。首先,現實中肯定不會是人人都絕頂聰明兼「絕對理性」。回到「強盜分金」的模型中,只要3號、4號或5號中有一個人偏離了絕對聰明兼絕頂理性的假設,強盜1號保不準就會被扔到海里去了。所以,1號首先要考慮的就是他的強盜兄弟們的聰明和理性究竟是不是靠得住,而斷斷不敢自取97顆金幣,拼了性命去狂賭。偏好和效用及其替代是另外的一個大問題。現實中人們是如此的複雜,某人的神經末稍微偏離一毫,就可能表現得對金幣滿不在乎而偏偏喜歡看同夥被扔進海里喂鯊魚。果真如此,1號自以為得計的方案豈不成了自掘墳墓?再就是俗話所說的「人心隔肚皮」。這翻譯成經濟學語言則是信息不對稱。由於信息不對稱,謊言和虛假承諾就大有用武之地,而陰謀也會像雜草般瘋長,並藉機獲益。譬如,2號完全可以對3、4、5號大放煙幕彈,假稱基於l號所提出的任何分配方案,他一定會再多加上一個金幣給他們。果真如此,結果又當如何?還有比上述情形更複雜的。讓我們試考慮分配規則變化的情形。通常,在現實世界中,人人都有自認的公平標準,因而時常會嘟囔:「誰動了我的乳酪?」可以料想,一旦1號所提方案和其所想的不符合,就會有人大鬧。當大家都鬧將起來的時候,l號能拿著97枚金幣毫髮不損地、鎮定自若地走出去嗎?最大的可能就是,強盜們會要求修改規則,然後重新分配。假如由一次博弈變成重複博弈呢,比如,大家講清楚下次再得100枚金幣時,先由2號強盜來分,然後是3號……「輪流坐莊」,這倒頗有點像西方國家的兩黨政治,當然,你也可以說,其實是民主制度下的分贓制。可能還會有比這鬧得更凶的。比如,四人會想:l號居然要獨得97枚金幣,這簡直是赤裸裸的剝削嘛!於是,他們立即起來「造反」,組成一個反l號的大聯盟並制定出新規則:四人平分金幣,獨將l號扔進大海……無須更多討論,我們或許能夠同意:現實的確是太複雜了,「強盜分金」之類的題目儘管很聰明,而且不乏啟發性,但也只能是「模型」而已。啟示:成功者最主要的工作,就是在最後如何做決定。當你做出高人一等的決策時,最好把它當做是僥倖,惟有如此,才能使你自己更謹慎,更成功。非理性還是理性「非理性」似乎是個貶義詞,可事實上,正是許多所謂「非理性」的行為促進了人類的福利。就拿前面那個分錢的遊戲來說吧,拒絕只得1分錢的分配方案真的不理智嗎?如果同意,你得到1分,對方獲得99.99元,對方從你身上佔盡了便宜;可是如果你拒絕,那麼你所損失的也就是這1分錢,而他損失99.99元,比你的損失要慘重得多。既然對於雙方達成交易的收益如此不平衡,那麼到底是你不「理性」,還是提出這麼個自作聰明的分配方法的他不「理性」?這類「非理性」行為正是依據人所推崇的「以直報怨」原則,我們的「公平」、「正義」等等觀念都是建立在這一基礎上的,如果這不叫理性,那麼什麼才叫理性?回報傷害的確不能醫治已有的傷害,正如懲罰一個殺人犯,被害者也不能復生一樣,但是它能有效防止新的傷害。現在有人告訴你:反正人已經死了,屬於「沉沒成本」,再怎麼也回不來了,何必再耗費社會資源懲罰罪犯呢?你一定會罵他「混賬」而不會誇他「理性」。而且,僅僅從策略的角度說,這種拒絕合作的「非理性」行為也是可取的,它其實有這樣的意思:你受的傷害,遠遠大於我受的傷害。如果你要避免這種最壞結果,你就不要傷害我。事實上,聰明人都懂得不要把事情做得太過火,古代的「明君」輕徭薄賦,也正是這個道理。只有那些昏君、暴君才會橫徵暴斂,就是因為他們把老百姓看得太「理性」,以為只要人民能對付活下去,就不敢造反尋死。這倒也不算錯。可往往是這樣:你越「理性」,對方就越「不理性」,你已經受不住了,可他還認為有「利潤空間」,繼續壓榨不休——正如我們在「剃刀邊緣」一章中談到的,人們很難知道「臨界點」的確切位置——終於弄到官逼民反、玉石俱焚的地步,莫非這個結果該怪老百姓「理性」不夠嗎?不要目光短淺其實,理性與非理性的區分,往往要看人們關注的目標,或者說,是短期利益與長期利益的不同。許多夫妻經常為了一些雞毛蒜皮的瑣事大吵大鬧,這當然可以被認為是非理性的,事過境遷,當事人可能也覺得不值得。可是下一次還是要吵鬧,為什麼?除了顧及面子這類「人性弱點」外,吵鬧還有一個爭奪家庭控制權或維護自身「話語權」的微妙作用。我們都知道「小洞不補,大洞尺五」的道理,在一些小事上退讓是理智的,可是誰能保證這不會助長對方的氣焰,並最終導致自己權利的喪失?所謂「不值得」的感覺並不是因為打架傷害感情,而是人們發現不能「一戰定乾坤」:吵了鬧了,可是沒什麼用處,下次還是要再交鋒。把這個問題放大看,民主政治中各種利益集團的爭吵都具有「夫妻吵架」的含義。我們時常可以看到某某國家政府、議會間僵持不下,導致效率低下、政府更迭或解散議會的事件,這些事件中當然有「非理性」的成分,但是比較合理的政治不正是在各利益集團的交鋒中達成的嗎?有這樣一個故事:一個男孩被視為傻瓜,因為每當別人拿一枚一角的硬幣和一枚五分的硬幣讓他選擇時,他總是選五分的硬幣拿。有一個人覺得很奇怪,就問這個男孩:「為什麼你不拿一角錢的?」小男孩小聲回答:「假若我拿的是一角硬幣,下一次他們就不會拿錢來給我選了。」這是目光長遠的最佳例子。這個男孩選五分的硬幣拿,從短期效果看「非理性」,但他明白這樣可以長期拿下去;選一角的硬幣,只能有眼前的利益,實際上並不是好辦法。戰術運用的目的是在「爭取主要的策略性目標」。一旦一個人開始將戰術目標想成最後目標,那他就看不見策略目標了。在談判中,雙方有時都會運用以進為退和以退為進的戰術,你不能因此忘掉談判的最後目的。你有時候也可以故作讓步,把對手誘到不利位置。一位將軍也許會假裝敗退,將敵人誘入不利的位置而加以殲滅。啟示:任何時候,只要可能,我們必須做最有成效的事情。此一時,彼一時我們已知要通過決策使可能的利益達到最大限度的原則,我們還知道,要完成這樣的最優化決策需要對所有信息進行全面的合理的評估。然而,在實際的決策中,最優化很難實現,即使實現了,也是暫時的。原因就在於,我們並不知道此時此地我們是否已經掌握了所有的與抉擇有關的信息,或者,我們不能確切地判斷這些信息是否會隨時間的推移而有所改變。實際上,我們每時每刻都在接受著各種信息,它們可能會對現實的問題及有關決策產生影響。如果不能對此有充分估計,如果在決策中只注重對現有信息的處理而忽視可能出現的變化,則很難使決策最優化,甚至每當你作出一個選擇時,你會發現它已經過時了,不適用了。我們來看這樣一個事例。一個大學生打算買一部照相機,他積攢了足夠的錢進城去。他來到甲商店,這裡他看到了心目中所期望的那種型號的相機,標價是165元。他覺得這價錢可以接受,但他又想:貨比三家不吃虧,最好還是再去別的地方多轉轉,或許還有更便宜的價格。他的這種想法無疑是正確的。從資訊理論看,多了解一些行情,才能作出最佳選擇。於是他又來到了乙商店,也找到了那種型號的相機,可標價卻185元,整多出了20元。顯然在這裡買太虧了。他毫不猶豫地退出了這家商店,決定再去找一家看看。他轉了許久,又到了丙商店,也看到有那種型號的相機出售,標價是170元。這標價雖不能說太高,可畢竟比甲商店裡的價格貴了5元。該怎麼樣辦呢?這時天色已晚,學生覺得又累又餓。究竟是該忍著飢餓與疲勞到甲商店去買便宜的相機?還是乾脆買這170元的相機,早點兒回去吃飯休息?他想來想去,覺得不值得為5元錢再跑那麼多路,於是選擇了後者。第二天,他不再飢餓了,體力已完全恢復了,昨天的疲乏消失得無影無蹤。他開始後悔了,覺得昨天還是應該堅持一下,省下那5元錢。事隔一天,這學生的決策完全不同了。可我們能說出哪個決策是正確的、哪個又是錯誤的嗎?幾乎不能。也許這學生當初的選擇是對的,只不過今天情境完全不同了,他才轉了念頭。完全有這樣的可能性:他昨天堅持了下來,又跑到甲商店省5元錢買下了相機,結果他太疲勞,第二天早上起不來,誤了課,甚至有可能餓過頭,鬧起胃疼。那樣他就會同樣後悔:昨天不該為那5元錢去奔命,何苦弄成今天這個樣子,太划不來了。這樣說來,無論他當初怎樣抉擇,他都終將會後悔的。這真是所謂「此一時也,彼一時也」,其實我們許多的實際抉擇都受所面臨的情境的牽制,而並非我們本身決策能力的高低所致。我們幾乎永遠都不可能掌握進入情境的全部因素。每時每刻都會有一些新的因素進入情境,而某些舊的因素則變得完全不重要了。於是,常常會有這種情形出現;此時作出的一個看來明顯是很愚蠢的抉擇,由於情境的變換,在彼時卻儼然是最合乎邏輯和最明智的了。因此,在實際的決策過程中,應把最大限度增大功利的原則作為一個根本性的基礎,不僅應全面地評估各個因素,而且應對可能的因素的變化作出儘可能的預測,從而使決策具有更普遍的意義和價值,實現功利效應的連續性。啟示:一位法官提出三種懲罰方式讓犯人自己選擇。第一種是罰100塊錢;第二種是抽50鞭子;第三種是吃下5公斤洋蔥。罪犯既怕花錢又怕挨打,就選擇了第三種。當吃下2公斤洋蔥之後,他流著眼淚喊道:「我不吃洋蔥了,我寧願挨50鞭子。」當鞭子落在他背上時,他疼得大叫起來。當打到第10下時,他終於受不了了。「可憐可憐我吧,別再打我了,就讓我出100塊錢吧!」這個罪犯,他不想挨打,又不想出錢,結果受到了三種懲罰。如果你支配金錢,那它就是一個好的僕人;如果金錢支配你,那它就是一個壞的主人。要冒險還是要成功有人說:沒有冒險的成功和沒有成功的冒險都是沒有價值的。儘管我們已對有關決策的策略及有關問題做了不少探討,可實際情形中的決策仍然要複雜得多。我們以往的討論是假定我們已經掌握了相當充分的信息,而且它們都是很明確的。然而,在現實中,我們常常面對的是不確定的情境。對於一個結果,我們知道它可能會發生,也可能不發生。這樣,我們在決策時就既要評價可能的結果的功利,又要對這可能性究竟有多大加以考察,並不得不對實際將發生什麼進行冒險。比如,你今天出門帶上一把傘,其價值要依賴於今天下雨的可能性有多大,你是否要對你的家庭財產保險不僅取決於你的財產有多少,也取決於它是否安全,有多大可能性會遭到打劫。人們在對功利和機遇兩個因素進行綜合考察,以決定是否進行冒險及如何冒險時,表現出某些特點。我們來看看下面的這個例子。現在有一組選擇。你寧願:1.肯定得到0.10元,還是有1/10的機會得到1元?2.肯定得到1元,還是有1/10的機會得到10元?3.肯定得到10元,還是有1/10的機會得到100元?4.肯定得到100元,還是有1/10的機會得到1 000元?5.肯定得到1 000元,還是有1/10的機會得到10 000元?6、肯定得到1 000 000元,還是有1/10的機會得到10 000 000元?首先,對於這一組選擇的兩種可能,人們是不無偏好的。對於選擇1,你一般認為是值得冒險的,即寧願只有十分之一的機會去得1元,而不願就此拿上0.10元罷手。同樣,你也會對10元冒險,而不願就此只拿到l元。你大概也會對100元冒險,而不願穩當地拿到10元。看樣子,你一直都傾向於冒險,表現出對大額金錢的偏好。然而,當選擇進行到一定時候,你的喜好模式肯定會顛倒,不會再對大額金錢去冒險,而寧願穩當地得到雖相對較小可也仍然不算少的一筆錢。除非你對冒險的刺激賦予極高的功利,否則你是不會不願意穩妥地拿到100萬元,而甘願去冒只有1/10的可能拿1000萬元的風險的。在選擇時,人們對較小的數額似乎覺得冒險的意義或者隨機取勝的可能性較大,於是甘願冒險。但隨著數額(即功利價值)的增大,人們對冒險變得越來越謹慎,似乎僥倖取勝的可能性變小了。其實,在這一系列選擇中,冒險取勝的可能性是一樣的,都是1/10。只是由於功利變大,其對人的重要性也增大,從而產生對機遇判斷的錯覺。每一個人轉變其選擇的偏好模式即從冒險改為穩妥地獲取有把握的東西的轉折點是不同的。這依賴於人現有的財富和經濟價值觀。越是富有的人,越是敢於冒險下大賭注,因為無論是小輸還是小贏,對他來說都沒有什麼意義。然而,對於街頭的乞丐,對於極端貧困的人來說,他可能甚至寧願選擇有把握拿到的0.10分,而未必會為把握不大的1元而冒險。因此,一個特定對象的價值既與其功利、出現的可能性的大小有關,也還與評價者本人的特點、與他的經濟狀況和價值觀有關。通過了解一個人在上述六項選擇中的哪一個轉換其偏好模式,我們可以大致了解他的經濟狀況和價值態度。這樣,我們在進行決策時,就應當在功利、機遇、個人條件三個方面上展開我們的思考,若有遺漏或不慎,就難免作出錯誤的決策。當你要冒險時,務必「三思而後行」。啟示:有冒險而成功的將領,沒有無備而勝利的軍隊。在不曾達到目的以前,儘可能保存好每一個銅板,儘可能不被眼前的事物牽絆,這是成功的必備條件,因為前面的路說不定很長。理性假設有用嗎如果經濟學建立在一個不可靠的理性假設上,那麼它還有什麼用呢?的確,不能說理性假設很完美,否則,經濟學家們就可以跑到股市上大賺一把,而不會在幾乎所有問題上都爭論不休了。但是我們不能否認,理性假設還是很有用,儘管有各種非理性行為存在,但是總體而言,人們還是懂得權衡利弊,並作出於己有利的選擇。前面的例子之所以「不合情理」,是因為經濟學家或博弈論專家為了說明道理,將理性「極端化」了。它們更像「守株待兔」、「鄭人買履」之類的寓言,內容雖然荒誕,但內涵合理。 其實,我們不必把理性看得太理想化或者高深莫測,生活中有大量理性選擇的例子。如普通百姓常說的「胳膊擰不過大腿」、「人在屋檐下,怎能不低頭」、「吃虧是福」等等,都是理性的表現,也正是前面那些例子中想要說明的道理。其實,人類的非理性並不集中體現在利益分配上,而是體現在對客觀事物的錯誤認識上。但這並非理性的困境,而是由於知識的缺乏導致的「非理性困境」。舉個例子:「計劃生育」在中國已經實行了20多年,但是「一對夫妻一個孩」只是在城市得到了比較嚴格的貫徹,在廣大農村地區,很多家庭會生育幾個小孩,至少在有一個男孩之前,人們不願停止生育。這倒未必是農民兄弟觀念落後的表現,而是家庭農業生產確實需要男丁。現在請考慮這個問題:假如每個家庭都要生一個男孩才肯停止生育,會不會導致人口比例失調?答案是不會。很簡單,每個家庭生育頭胎的機率,男女比例是1∶1;生育第二胎的比例仍然是1∶1;第三胎還是一樣,在每一輪生育中,女孩的數目總是趨向於與男孩的數目相等,因此男孩與女孩的比例是永遠也不會改變的。既然在任何一輪的生育中,男孩對女孩的比例都是1∶1,那麼當你把各輪生育的結果全部加起來以後,比例始終保持著1∶1。只要排除流產女嬰的人為因素,男女比例就不會失調。所以說,與其為人類理性的局限擔憂(當然,這些局限確實存在,後面我們還要討論),還不如通過不斷發現和掌握新知,使我們擺脫非理性的困擾,決定我們的對策和選擇。第14章 阿羅「不可能」定理簡單地說,政治就是人的組織藝術。完美的政治是可能的嗎?阿羅「不可能」定理給了我們一個答案。你可能對此感到失望,但是,寧可知道不存在答案的問題,也決不要假裝不存在任何問題。阿羅「不可能」定理我們有時會陷入因選擇太多而無所適從的局面,在前面的「約會遊戲」中,我們的規則是不允許把約會對象一個個比較,其實,即使允許這樣做,也未必能找到「最理想」的一個。比如,A、B和C都很不錯,但是各有特點:A很風趣,B很成熟,C很浪漫,讓你決定不下。能不能給這三種特點排坐次呢?你可能覺得風趣不如成熟可靠,可成熟沒有浪漫有情調,而浪漫呢,又不如風趣那樣讓你開心!所以有句俏皮話說:一個女人需要三個丈夫!這還只是個人選擇,如果要很多人在這些特點中作選擇(比如你的父母、姨媽、兄弟姐妹都很關心你的終身大事,都來發表意見),那麼想要得出一個大家滿意的結論幾乎就是不可能的。當然,這件事還是可以由你做主(畢竟是你自己的事嘛),可是如果換成全家商量要去三個地方旅遊,或添置什麼大件商品,又該如何決斷呢?換成一個團體乃至一個國家,又會怎樣?對於社會的選擇問題,斯坦福大學教授肯尼思·阿羅由這一類難題中,得出了著名的「不可能」定理。阿羅認為,在非獨裁的情況下,任何一個體系,若要將人們對三個或三個以上的選擇作出一項集體抉擇,不存在任何加總社會個體成員偏好的方法。所謂加總社會偏好,即找到一個社會偏好函數,它必須同時滿足以下幾個最基本的要求:(1)傳遞性,(2)全體一致性,(3)不相關選擇的相互獨立性,(4)非獨裁性。傳遞性的要求是,假如人們在A和B之間選擇A,在B和C之間選擇B,那麼人們在A和C之間必然選擇A。全體一致性的要求是,假如在A和B之間一致傾向於A,那麼,人們就會選擇A而非B。不相關選擇之間的相互獨立性的要求是,人們在A和B之間作的選擇並不取決於是不是存在另外一個選項C。非獨裁性的要求是,沒有任何人可以每次都得逞,因而不存在獨裁的力量。啟示:有人問英國經濟學家悉尼·韋布的妻子比阿特里,為什麼對一些當代重大問題,韋布家的觀點是如此的一致?這位跟丈夫合作寫了許多有深遠影響著作的妻子解釋說,在結婚時我們就商量好了,在重大問題上要意見一致,「悉尼決定我們怎樣投票,我則確定什麼是重大問題。」民主是一種妄想或自相矛盾自從1951年肯尼思·阿羅令人信服地論證出了這個結論,即任何可以想得出的民主選舉制度可能產生出不民主結果,這一論證使數學家和經濟學家感到震驚。阿羅這種令人不安的對策論論證立即在全世界學術界中引起了評論。1952年,後來在經濟科學方面獲諾貝爾獎的保羅·薩繆爾森這樣寫道:「這證明了探索完全民主的歷史記錄下的偉大思想也是探索一種妄想、一種邏輯上的自相矛盾。現在全世界的學者們——數學的,政治的,哲學的和經濟學的——都在試圖進行挽救,都試圖挽救阿羅的毀滅性發現中能夠挽救出的東西,對數學政治來說,這一發現就是1931年庫爾特·哥德爾的數學邏輯的不可能證明一致性定理。」阿羅的論證,稱之為不可能性定理(因為它證明了完全民主在事實上是不可能的),該論證幫助他於1972年獲得了諾貝爾經濟科學獎。對策論中最早的和最驚人的成果之一,也就是阿羅的「毀滅性發現」所產生的影響使人們至今還能感覺到。在民主投票中所固有的不民主悖論可以用一實例進行很好的解釋。假定有三個候選人——甲、乙、丙,民意測驗表明:選民中有2/3願意選甲而不選乙,2/3願意選乙而不選丙,那麼是否意味著,喜歡甲的選民一定超過喜歡丙的?未必!如果選民的態度有三種,分別是:甲、乙、丙;乙、丙、甲;丙、甲、乙,持三種態度的人各佔總數1/3,那麼就會出現一個怪圈:2/3人喜歡甲超過乙,2/3人喜歡乙超過丙;2/3人喜歡丙超過甲!這個例子反映的道理是深刻的,如果是社會對幾個方案進行表決,如國家選舉總統、某個城市讓市民決定先修建哪個公共事業工程,等等,社會投票很可能得出矛盾的結果。既不一定正確,也不一定公平阿羅定理指的是,社會沒有一種「客觀的」反映群體的社會偏好的方法。如果某種偏好得以反映出來,如小布希而不是戈爾當選美國第53任總統,完全取決於所確定的「民主」的選舉規則。另外一套規則得出的完全可能是另外一種結果。戈爾比小布希多幾十萬張選票,然而美國實行的投票人制度是,誰獲得了某一州的多數票,那麼他就獲得該州所分配的選舉人的選票。小布希與戈爾之爭的關鍵是佛羅里達州的選舉結果,布希獲勝就在於他以微弱優勢獲得了佛羅里達州的25張選舉人票。最後,小布希與戈爾的選票之比為277:266。小布希獲勝。你會說,通過一次性投票來決定誰當選,這應該是合理的,即對候選人或候選方案進行一次性表決。但是,這很有可能讓選民最不喜歡的人或方案當選。舉一個例子。假定有4個人,他們是A、B、C、D,假定有26%的人「最喜歡」A,各有25%的人「最喜歡」B和C,有24%的人「最喜歡」D。現在進行一次性投票,A當選。而很有可能的情況是「最喜歡」B、C、D的那些人「最不喜歡」A,即:「最不喜歡」A的人有74%!在這種規則下,最多人「最不喜歡」的人當選了!這樣的規則合理嗎?如果有一種確定了的規則,並且候選人的競選綱領在選民心裡得到確定的定位,即每個選民針對不同的候選人確定了其偏好程度,那麼結果是確定的。而為什麼不同的候選人同意同樣的規則呢?因為,每個候選人總會盡量以其競選綱領及個人魅力贏得選民的偏好。這裡有一個真理:假如你的競選綱領及個人魅力贏得了所有的選民,即對所有選民進行偏好排序你都是在最前面的,那麼在任何選舉規則下你都會被選中。同樣,如果你永遠排在最後面,那麼無論什麼規則,你都不會被選中。這一點可以用數學證明。同時,候選人接納某種民主的選舉規則而參與競選,是因為他無法預先知道每個選民的偏好。民主的選舉是人們以此來揭示選民的心理排序情形的方法。阿羅不可能性定理正說明了人的有限理性的悖論。此外,阿羅定理說的是,社會的選擇方法不可能既是有效率的,又是民主的。因為循環投票本身就是無效率的。而有效率的方式必須是獨裁的。這就再次揭示了民主和效率的矛盾。啟示:美國南北戰爭結束後,一位叫馬維爾的記者去採訪林肯,他們之間有這麼一段對話。馬維爾:「據我所知,上兩屆總統都曾想過廢除黑奴制,《解放黑奴宣言》也早在他們那個時期就已草就,可是他們都沒拿起筆簽署它。請問總統先生,他們是不是想把這一偉業留給你去成就英名?」林肯答:「可能有這個意思吧。不過,如果他們知道拿起筆需要的僅是一點勇氣,我想他們一定非常懊喪。」其實,何謂能行,何謂不成,大多數人都無從明確把握。團體決策的困境和其他類型的多人博弈一樣,投票當中也會出現策略問題。投票者常常不願表達自己的真實傾向。無論是少數服從多數的規則,或是任何其他投票機制,都不能解決這個問題,因為現在尚不存在一個完美無缺的體系,可以將個人的傾向會聚成人民的意願。比如,三位女郎結伴逛街,臨近中午她們打算一起吃午飯。她們都喜歡洋快餐,正好這條街上有麥當勞、肯德基和必勝客,可是每個人的偏好不同:A喜歡麥當勞,其次是肯德基,最不喜歡必勝客;B的偏好依次是肯德基、麥當勞、必勝客;C的選擇卻又不同:必勝客、麥當勞、肯德基。假定這三人一定要一起吃飯,那麼會出現什麼結果呢?因為三個人的喜好如此不同,難於達成一致,所以她們決定採取投票表決的方式,先在麥當勞與必勝客之間決出一個勝者,然後再與肯德基決勝。如果是每個人都誠實投票,那麼,麥當勞將戰勝必勝客(因為B在兩者之間傾向於前者),並在第二輪戰勝肯德基。但是如果B不誠實投票,結果就會大不一樣。B知道其他人的偏好,而且她希望達到自己滿意的結果,於是在第一輪故意投票給必勝客,於是必勝客獲勝;在第二輪,肯德基又戰勝必勝客,於是,B通過策略實現了自己的願望。可是這個願望並不是符合大家的最大利益的——理想的結果應該是麥當勞,因為在三個人的綜合評價中,它的分數最高。因此投票制的民主實是知易行難,由於排名內部的模稜兩可,造成狡猾的候選人有極大的操弄空間,無論什麼規則都會造成公平選舉遭到扭曲。所有政治演說也常談到尊重「人民意願」,卻不容易做到。事實上,也幾乎不可能決定何者是人民的意願。通常宣稱實行民主制度,遠比實際實施民主要容易得多。顯然這種決策困境亟待深入探討。啟示:民主政府的基石在於尊重人民通過投票箱表達的意願。不幸的是,這些崇高偉大的想法實現起來並不那麼容易。「三個快槍手」細緻煩瑣的推理過程也許讓你有點疲憊了,下面我們來點刺激的,到充斥著野蠻暴力的西部世界(至少是西部片的世界)去走一遭。在一個西部小鎮上,三個槍手正在進行生死決鬥,槍手甲槍法精準,十發八中;槍手乙槍法不錯,十發六中;槍手丙槍法拙劣,十發四中。假如三人同時開槍,誰活下來的機會大一些?假如你認為是槍手甲,結果可能會讓你大吃一驚:最可能活下來的是丙——槍法最劣的那個傢伙。假如這三個人彼此痛恨,都不可能達成協議,那麼作為槍手甲,他一定要對槍手乙開槍。這是他的最佳策略,因為此人威脅最大。這樣他的第一槍不可能瞄準丙。同樣,槍手乙也會把甲作為第一目標,很明白,一旦把他幹掉,下一輪(如果還有下一輪的話)和丙對決,他的勝算較大。相反,如果他先打丙,即使活到了下一輪,與甲對決也是凶多吉少。丙呢?自然也要對甲開槍,因為不管怎麼說,槍手乙到底比甲差一些(儘管還是比自己強),如果一定要和某個人對決下一場的話,選擇槍手乙,自己獲勝的機會要比對決甲多少大一點。於是第一陣亂槍過後,甲還能活下來的機會少得可憐(將近10%),乙是20%,丙是100%。通過概率分析,你會發現丙很可能在這一輪就成為勝利者,即使某個對手幸運地活下來,在下一輪的對決中,也並非十拿九穩,畢竟丙還有微弱的機會。現在換一種玩法(我們知道,有時勝負是由規則決定的):三個人輪流開槍,誰的機會更大?這裡我們又要遇到瑣碎的排序問題,但不管怎麼排,丙的機會都好於他的實力。至少,他不會被第一槍打死。而且,他很可能有在第二輪首先開槍的便宜。例如,順序是甲、乙、丙,甲一槍幹掉了乙,現在,就論到丙開槍了——儘管槍法不怎麼樣,但這個便宜還是很大的:那意味著他將近一半的機會贏得這次決鬥(畢竟甲也不是百發百中)。如果乙幸運地躲過了甲的攻擊呢?他一定要回擊甲,這樣即使他成功,下一輪還是輪到丙開槍,自然,他的成功概率就更大了。問題來了:如果三人中首先開槍的是丙,他該怎麼辦?他可以朝甲開槍,即使打不中,甲也不太可能回擊,畢竟這傢伙不是主要威脅,可是萬一他打中了呢?下一輪可就是乙開槍了……可能你會感到有點奇怪:丙的最佳策略是亂開一槍!只要他不打中任何人,不破壞這個局面,他就總是有利可圖的。(當然,你可能會說,鑒於這傢伙的沒有準頭,也許他亂開槍反而更可能打中什麼人。但那就是另外的問題了。)這個故事告訴我們:在多人博弈中,常常會發生一些奇奇怪怪的事情,並導致出人意料的結局。一方能否獲勝,不僅僅取決於他的實力,更取決於實力對比造成的複雜關係。啟示:通過這個故事,你也可能會理解以下「定理」:才華出眾者創造歷史;碌碌無為者繁衍子孫。暫時同盟你可能已經發現:乙和丙似乎達成了某種默契:在甲被幹掉之前,他們相互不是敵人。這不難理解,畢竟人總要優先考慮對付最大的威脅,同時這個威脅還為他們找到了共同利益,聯手打倒這個人,他們的生存機會都上升。而且,從悲觀的角度看,他們恐怕也活不到需要相互拼個你死我活的時候。但這個「同盟」也是很不牢固的,兩個人都在時時權衡利弊,一旦背叛的好處大於默契的好處,他們馬上就會翻臉。在這個「同盟」里,最忠誠的是乙——只要甲不死,他就不會背叛;丙就要滑頭多了,在前面輪流開槍的例子中,他不朝甲開槍,從同盟者的角度說,就是沒有履行義務,而把盟友送上危險的境地,這不是因為道德水平不同,而是處境不同。乙是甲的頭號目標,這個敵人一定要向他開槍的,完全沒有迴旋的餘地;而丙不同,他隨時願意犧牲乙換取下次自己的先手之利。除了壓力較小之外,而且還有一個動力驅使丙背叛,那就是一旦幹掉甲後,乙的機會比他要大,他至少要保持先下手,才可能一爭高下。三國博弈三國的曹、劉、孫三家關係,就是「槍手博弈」很典型、也很有趣的例子。「赤壁之戰」中,曹操實力最強,孫權次之,劉備最弱。孫、劉都無法單獨對抗曹操。為了抵擋最強大的曹操,孫劉必須聯合起來。孫權擁有六個郡的地盤和數萬軍隊,而劉備沒有地盤,只有不足兩萬人馬。用前面的例子來比,孫權是乙,劉備是丙。我們已經知道,乙是這個「暫時聯盟」中較肯賣力的一方,所以孫權不但「火燒赤壁」打敗曹操,更在此後還長期承擔了對抗曹操的主要任務。而劉備雖在赤壁之戰中也出了力,但此後幾年未與曹操打過大仗(也就是沒有盡聯盟義務)。倒是趁此機會掃蕩地方勢力,擴充地盤,直至佔據兩川,將曹操趕出漢中,又派關羽北伐,水淹七軍,不但取代了孫權原來的老二地位,甚至有可能擊敗曹操,成為新的老大。孫權地位跌落到老三,他的策略也隨之改變。於是孫權趁關羽北伐後方空虛之機,與曹操合謀,奪取了荊州,殺死關羽。結果是同盟破裂,劉備興兵報仇,又被孫權打敗。蜀漢從此衰落,東吳也面臨了兩面作戰的不利局面。如果分析一下孫權的心理,我們可能對他的背信棄義有更多同情。赤壁之戰儘管符合他的利益,但到底是他出力挽救了劉備,此後他不但把荊州長期借給劉備,還把妹妹嫁給了這個老頭子。他盡了同盟的義務,曾與曹操大戰數次,不僅損兵折將(他的大將太史慈、董襲、陳武等都在戰鬥中陣亡),而且他自己也險些在逍遙津送命。可是從收益上說,他與劉備是「牛打江山馬坐殿」,感到不平衡是正常的。可是從對策論來看,孫權卻犯了一個大錯誤,由於嫉妒,他過早和劉備翻臉,致使兩敗俱傷。這就好比槍手丙突然翻臉向乙開火。坐收漁利的當然是甲。雖然曹操的繼任者曹丕沒能抓住機會夾攻孫權,一舉消滅這兩個敵手,但蜀和吳此後已經沒有可能打敗魏國了。那麼,孫權的最優策略是什麼?回想上面的槍手決鬥就明白了。既然已經落到丙的地位,就該以丙的策略行事。讓劉備去和曹操惡鬥,自己擴充勢力,養精蓄銳,隨機應變。無論兩者勝負,自己都能從中漁利。這個問題是對策論中諸多問題中典型的一個。其基本前提是每位參賽者都是有理性的,而且都是力圖為自身利益考慮。這個問題的一項教益在於,顯而易見的策略——每位參賽者都試圖除掉較強的對手——並不一定是好策略。這就是人們認為解法是反直覺的解釋。當然,由於你更進一步地投身於對策論,那麼你的直覺就會改變,而且如果它是完全意想不到的話,則意想不到的局面就會更加意想不到。槍戰決鬥的另一項教益是,在缺乏有關參賽者能否聯絡、共謀、進行威脅或達成有約束力並可以實施的協議等信息的情況下,對可能的解法是不能進行正確評估的。在對策論中,往往需要了解這樣的社會學因素。無須試圖進行嚴格的論證,我們就能很容易地理解,槍戰決鬥可能類似於政治或經濟的競爭。按照紐約大學政治學教授斯蒂溫·布拉姆斯的看法:槍戰決鬥的知識可以擴展到多位候選人的政治競選上,布拉姆斯說道:「看來這些候選人的最佳戰略,莫過於在他的部分政治勢力範圍內追隨最強的對手。如果你是一個自由主義者,而且另外還有兩位自由主義者,那麼你就要追隨最強的一位。於是所發生的情況將是兩位最強的對手就會彼此攻擊,而且最弱者就會存留下來了。」這時,如果所發生的情況全面出現,那麼最弱的候選人就會在其政治勢力範圍內倖存下來。啟示1:公元196年,曹操挾天子以令諸侯,東漢政權明存實亡;公元200元,官渡之戰,曹操大敗袁紹,羽翼漸豐;公元208年,曹操揮軍南下,大治水軍,想收取江東。但赤壁之戰,曹軍為孫權劉備聯軍所破。三分天下的形勢從這時開始初步形成。啟示2:幾千年來,人類始終把一條黃金法則當成行為的準則。這項法則是:種什麼因,收什麼果,你如何對待別人,你種的善因或惡因,最後都會報應到你自己的身上。雜貨鋪與政黨那麼,現代西方民主政治中的黨派之爭,是如何避免「三個快槍手」無休無止的廝殺呢?答案是「兩個雜貨鋪」。雜貨鋪定位問題最早是由美國經濟學家霍特林提出來的(即霍特林模型)。這一模型常被運用來說明西方兩黨政治的若干現象。西方一些大國,都有相似的兩黨政治。在英國是保守黨和工黨輪流執政,在美國則是共和黨和民主黨輪流坐莊。民主黨和工黨一般被認為是「左派」,傾向於標榜代表勞工階層的利益,共和黨和保守黨則是「右派」,站在企業主一邊。在競選的時候,人們可以發現,兩黨互相攻擊越來越厲害,可是實際政治綱領卻越來越靠近。等到一個政黨獲勝取代對手上台以後,選民發現,新政府較老政府並沒有多少實質性的改變。為什麼會這樣呢?進一步,為什麼這些西方大國都會出現兩黨政治呢?實際情況就和雜貨鋪定位博弈一樣。工黨一定要打出勞工代言人的旗幟,所以它是站在左邊的,左邊是它的地盤。但是只有左邊一半的選民,還不足以保證勝出。為了在競選中獲勝,它要想辦法把中間的在兩黨之間搖擺的選民爭取過來。最好的辦法就是使自己的競選綱領向「右」的方向靠過去一點,即在競選中宣布也要照顧中產階級的利益,甚至兼顧企業主發財。移過去一點,地盤就可能大一點。同樣,原來立黨之本是在「右」邊的保守黨,在競選的過程中也要往左邊靠,以爭取更多的選民。這樣鬥法的結果,在漫長的競選過程中,雖然兩黨的攻擊和謾罵不斷升級,但是實際綱領卻不斷靠近,直到兩個政黨在中點緊挨在一起,才是穩定的納什均衡。為什麼第三個政黨難成氣候?這是因為在上述假定條件之下,如果三個政黨的位置不相同,不在同一個點上,那麼至少有一個政黨單獨位於一端,它就有向內擠壓的動機,道理和前面論述的一樣,所以這時候不是穩定的局面。如果三個黨都位於中點,那麼誰單獨跳開一點點,誰就會取勝,所以也是不穩定的局面,這是因為從中心跳開一點(無論向左向右)的時候,至少那一邊的選民都會投他的票,例如,向左一點,左邊的選民就會選他;而另一邊的選民要由留在中點的兩個政黨來瓜分,這兩個黨各自的得票,就都比不上跳開的那個黨。同樣,如果三個政黨位於同一點,但是這一點不是中點,那麼誰單獨向中點稍微移動一點點,它就會佔便宜,這是因為從旁邊向中點移動一點的時候,多數選民都會投他的票,而另外兩個政黨則只能平分不到總數一半的選民。三個黨不在一起不穩定,三個黨全在中點也不穩定,三個黨全在另外一點更不穩定,總起來一句話,就是三黨政治不會穩定。或者換一個角度理解,即綱領變化無常的政黨不會有較強的生命力。這個政黨綱領向中點移動的機制,也說明西方兩黨政治的欺騙性,競選的時候,怎樣有利於拉票就怎樣講,當選以後可以忘得一乾二淨。從這個意義上說,不要以為哪個政黨上台這些西方國家的政治態度就會根本改變,確實很有道理。當然,從另一個角度看,這種兩黨政治主張的趨同性其實也並不完全是壞事——甚或可以說是好事,因為所謂民主政治,就是要最大限度地照顧每個人的利益,儘管免不了有妥協和交易,但要把不同階級、不同政治理想和利益要求的人組織成一個整體,這些代價也許是不得不付出的。啟示:所謂雜貨鋪定位問題,簡單說就是:在一條街道上有兩家雜貨鋪,為了爭取更多顧客,兩家雜貨鋪都趨向於把店鋪設在街道中心點,最後的均衡是,兩家雜貨鋪都開設在整條街的中點,緊緊挨在一起。效能與民意在信息暢達迅捷的媒體時代,政治家很仰賴民意調查來了解選民的需求,以避免招惹潛在選民的不滿。而民眾選擇政府的同時,也就決定政府的決策品質。社會學家發現:效率與民主或「社會公正」有時是矛盾的。比如像長城或金字塔那樣的建築,只能出現在專制的社會中。現代社會中,不論是哪個國家,都有太多方法可以阻斷事務的進行,卻沒有足夠的方法來推動事務的發展。古代的法老王有絕對權威,花上數十年,甚至更長的時間來建造金字塔;羅馬教會的權勢,使它可以用好幾代的光陰去蓋一座天主教堂;而一位皇帝想修一座宮殿,也就不須多費唇舌解釋。大眾決策絕不會有任何冒險性,因為在這個大眾傳播與民調盛行的年代,政治人物若想要保住飯碗(這可是人人夢寐以求的),就不能冒險作出任何不受歡迎的決策。民意有兩個難題:首先,多數不一定正確,至少有時,真理是掌握在少數人手裡的;其次,民意容易受到操縱和利用,不要忘了,希特勒正是通過鼓惑人心的本領被選舉上台的。下面一段也是引自《是,首相》,以一個文官之口,講述他的上司向他解釋操縱民意的訣竅。我不懂選民怎麼能同時贊成而又反對一件事。親愛的漢弗萊告訴我怎麼做。訣竅是,向一個普通老百姓提出一系列的問題——去接近他的是一個有吸引力的女士,手裡拿著一個寫字板。自然,這個普通老百姓要給人一個好印象,不願使自己干蠢事。因此,市場調查者就會問他旨在引出一貫式答覆的問題。漢弗萊在我身上作示範。「伍利先生,青少年犯罪率上升,你擔心嗎?」「是。」我說。「你是否認為在我們的學校里缺乏紀律和嚴格訓練?」「是。」「你認為年青人歡迎在他們生活中搞一些組織和領導工作?「「是。」「對他們提出挑戰性的要求,他們會有反響嗎?」「會。」「也許你贊成重新恢復兵役?」「是。」嗯,我自然而然地說「是」。一個人為了不讓別人看來缺乏一貫性,幾乎不太可能回答其他的話。那麼,所產生的事實是,民意調查光發表最後的一個問題及其答覆。漢弗萊建議我們委託別人舉行一次新的調查,我們就這樣幹了。他當時當場炮製了一連串問題:「伍利先生,你是不是擔心爆發戰爭?」「是。」我說,十分真誠。「你對軍備的增長很不高興吧?」「是。」「你認為發給青年人槍支並教他們如何殺人,有危險嗎?」「是。」「你認為違反人們的意志,強迫他們拿起武器是錯誤的嗎?」「是。」「你會反對恢復兵役嗎?」我不知不覺、不由自主地答「是」。漢弗萊成功了,他高興得很。「你瞧,伯納德,」他對我說,「你是一個完美的不偏不倚的樣板。」至少在某些情況下,民意是一團可以捏來捏去的面。因此在面對聲稱「代表民意」的宣傳高調時,不必過於在意。但是總的說來,各個階層的民眾還是懂得維護自身的利益的,並為此爭吵不休。所以在選擇政府官員或議員時,所面臨的衝突就是目標設定:究竟要一個有效能的政府?它除了領導、遠見外,還包括了一些必然不受歡迎的決策;還是選一個能反映大眾期望、欲求的體制,只剝奪少數人民權利,卻又能表達一般選民的不同意見。兩個不同的目標,將會產生不同的選舉制度。各種投票制度的利弊採用「多數為王」制的最大弊端,就是在選舉後將使大部分民眾不再具影響力,而少數人就像戰敗的軍隊般,只能為下次競選作準備,影響力亦幾乎為零,而他們扮演在野角色時,仍是以下次選舉作為出發點。與「多數為王」相反的選舉制度就是以投票比例決定各黨代表的席次,以確保政府或民主制度中的立法單位在運作過程中,不會忽視所有人的意見。如果在1992年美國大選中,佩羅陣營組成政黨,且總統候選人的政黨比例是由各候選人的實際得票率來計算,則比例代表制的結果會造成國會有43%民主黨、38%共和黨及19%的佩羅黨。而賽局理論的技術準則為結合各少數黨擊垮最大黨,但隨著組合的改變,就會產生混亂。許多歐洲國家都採用這樣的制度,美國部分地區也嘗試過,但世界各地的經驗顯示,有效能的政府需要在不同方案間決策,而高度分散化的團體則很難在影響深遠的選擇間作出決定。那些大聲疾呼多元化可強化社會結構的論調,實在很難從歷史上找到佐證。比如代表制雖不會蹂躪少數人的權益,卻也不易實施多數人的願望。不論選擇為何,最後都會回歸到原來追求的目標。即使所談的是一個小範圍選舉,也沒有不一致的現象發生,選舉結果還是跟選舉規則息息相關。舉例來說,A、B、C3人競選某一公職,而9位選民的偏好如下:有2位選民認為A是上選,B次佳,C為第三。4位首選C,A次之,B第三。3人首選B,A第二,C第三。在多數決的制度下,只有第一選擇的票數有效,因此C獲得4票為勝利者,B、A則各得3票及2票。在這個例子中,很明顯多數的人並不喜歡C,但他卻擁有忠貞選民。這種現象在日常生活中很常見,雖然C沒有贏得絕對多數,但仍然勝選,這和1992年柯林頓當選總統的情況相同。再看看其他的投票制度是怎麼處理這個問題的。有一種常見的方法是加權計票,也就是名列二、三名的選擇也予以加權計分。如第一名2分、第二名1分、第三名0分。這就是所謂的波達規則。在這樣的規則之下,A得11分,反敗為勝,而B與C皆得8分,打成平手。支持A優勝的原因是,有7個人將他排名在第二位,雖然認為A是最佳人選的人並不多,但他卻比C得到更多的認同。另一個常用的制度為偏好投票,就是要求選民如上表一樣,標示出第一、第二的名次。只要候選人擁有絕對多數的第一名選票,即可獲勝。如果沒有優勝者,就把得到第一名票數最少的人剔除,再將其得票依照選票上的次序,重新分配給其餘的候選人。因此,A將會最先被淘汰出局,這與前一種制度比,他因認同度高,故脫穎而出的結果有很大的不同。再回到偏好投票下,兩張選票就會分給B,使B得票超過C而勝選,但在原制度下卻只得第二名。這種制度的好處就是考慮A的支持者在A落選後,他們的第二選擇仍有機會勝出。這樣不也挺公平嗎?選民的選擇不變,3種不同的投票制,產生3位不同的優勝者,這代表了3種選舉制度目標的歧異。當然還有其他的計票法。其中的認可投票制即相當受專家的肯定。在這種制度下,每位選民皆不限票數,可以投給每一個他所喜歡的候選人,但對每一個候選人限投一票。這種制度乍聽之下好像不怎麼公平,因為在沒有限制投票數的情況下,有人可能會投很多票。其實這種想法是錯誤的。如果你投給每一個候選人,那和沒投是一樣的。用這種方式就不需要對候選人排序,只要把認可的名單挑出來即可,所以稱之為認可投票制,而勝選者就是獲得最多認可票的那一位。這種制度應用到上述例子,因為資訊實在不多,故假設每個人都投給前二名候選人,也就是前二人當選都可以接受,但絕不可以讓最後一名當選。如此一來,A將因沒有人把他排在最後一位而以9票當選,另外兩人則分獲5票與4票。故在認可投票制下,其結果與加權投票制是一樣的。不過,也不能將其過度的類化,畢竟在3位候選人、4種選舉制度下,本來就有可能產生相同結果。啟示1:在美國這樣主政者任期較短的國家,人們可以期待下一次的選舉;但在任期較長的國家,一次失利則代表著會有很長一段時間失去影響力,而勝選陣營常在任期結束後仍繼續掌權。啟示2:決策之思考應著眼於長遠利益,著眼於未來。「英雄」為何成了失敗者在這個例子里,多數決勝制選出了C;加權制由A勝選;偏好制在去掉了A後,B以高票當選;而認可投票制則仍是A獲勝。那麼,究竟誰才是「民眾真正的期待」?在美國許多州和城市,及其他國家的國會選舉中,在多位角逐者的情況下,經常採用的選舉方式就是複選制。就是每個選民只投一票,當沒有人得票過半時,則在最高票的兩人中再行複選。這種做法是希望留下較強的兩個候選人,再請選民從中作出選擇,看起來很公平,且被廣泛採用。但是這種制度也有暗藏的陷阱,現在就來看看其中一例。它也用類似前面提到的情況,共有17個投票人,但情況更混亂些。假定在全部選民中,最喜歡A、B的分別有6人,首選B和C的5人,而在首選B和C的選民中,又分別有2和3人把A作為第二選擇,如果是這樣的話,首輪選舉的結果是A與B同得6票平手,C慘遭淘汰。由於沒有人過半數,故進行複選。3位C的支持者轉而投給次選A,2位投給B,使A以這1票取得絕對多數,勝過B。在A與B的決戰里,複選發揮了功能,A是「民眾真正的期待」,應該擔任這個職務。如果到此為止,複選制似乎不失為比較理想的方法。但是其中也有悖論:假設第一次選舉前,A展示了一件英雄行為,如救起一個溺水的小孩,或爬到樹上救下一隻貓,使B的部分支持者(即對A也有好感的那2人)在最後一分鐘決定改投給A。如此一來,在第一次投票中,A得到8票,可惜因為未過半數無法立刻取得勝利;B則因少了2票遭到淘汰。在複選里,A仍維持8票,而C則因獲得B選民的4票後來居上,贏得最後勝利。這種情況確實令人訝異,也很難以接受,畢竟人們總是希望選舉結果多少能反映選民的心聲。而A如果沒有那樁英雄事迹所多帶來的幾張選票,他早就贏了。如果制度讓原來可以選上的候選人,因為做了某件吸引更多選票的事而敗選,那就荒謬透了。當然,這種情況也許不多見,也根本不應該發生,偏偏這種複選制度無處不在。當然,精明的政客早就學會如何利用這種制度的弱點,而在初選時先支持較弱的對手,等他進入複選再一舉殲滅。由此可知,不同選舉制度滿足的是不同的需求。「多數為王」制戕害少數人的意見,但有時亦可能戕害多數民意。在一些國家普遍實施的比例代表制對領先的候選人不利,且常產生無能、沒有效率的政府。專制有利決策的進行,但制衡機制不足,特別是對可怕的決策缺乏防備功能。不過在碰到危機時,有效的領導可以處理攸關生死的決定,因為即使是無能的將領,都強過群龍無首的局面。雖然現代社會極度強調最大的個人自由和民主規範,亦相當重視全球各地所遭受的資源短缺等問題,但和生存問題一比,就成為次要的考慮。不過,這些問題的重要性超越時空,影響大於投票制度,更不可能在這本簡單的決策書中找到解決之道。即使真正解決了投票制的難題,這種想要透過它來汲取選民的想法,其本身就必須十分清楚明確,而目前的各種投票制度偏偏就欠缺了這個基本條件。啟示:加拿大雁有一種合作的本能,它們飛行時都呈V型。這些雁飛行時定期變換領導者,因為為首的雁在前面開路,能幫助後面的兩支隊伍形成局部的真空。科學家發現,雁以這種形式飛行,要比單獨飛行多出12%的距離。合作,不僅是一種工作而已。事實上,合作是一切團體繁盛的根本,而要達成合作,惟有參與。絕對正確的決策是可能的嗎我們不是因一貫正確而獲得權威,而是因獲得了權威而一貫正確。——美國聯邦大法官傑克遜現在,人們普遍相信民主政治比獨裁政治更能保證決策的正確性,那麼,民主是絕對正確的嗎?民主是什麼?簡單地說,就是少數服從多數。可為什麼少數一定要服從多數?或者為什麼這樣就是好的?這問題其實並不好回答。人們通常給出以下三個理由:1.少數服從多數,因為胳膊反正拗不過大腿,真要打起來,少數勢必打不過多數。以點人頭的方式(即投票的方式)來確定何種意見得到了更大的支持,要比採取戰鬥的方式成本更低。民主乃是人類有史以來發現的惟一的和平變革的方法。(這有點像動物在求偶時比羽毛或塊頭的辦法。)不服從,往輕了說是不明智;重了說,是敬酒不吃吃罰酒。2.多數人的決定比少數人的明智。這建立在一個假設前提下:人們是知道自己利益所在的。這至少在有時候不是事實。畢竟,雅典人也是通過民主投票的方式決定處死他們最偉大的哲學家蘇格拉底的。3.多數人也可能犯錯,可是不能剝奪他們表達意見的權利。而且,只有為自己做主,才能學會怎樣為自己做主。哪個理由都不那麼叫人放心。第一個告訴我們:所謂民主,不過是強權的另一張面孔;第二個是說:如果你是那掌握了真理的少數,你只能看著大家裹著你往火坑裡跳;第三個呢?是說你有權保持愚蠢,如果你放棄這個權利,別人也會代替你愚蠢。當然,如果你運氣好,可能從中學到點什麼,如果運氣再好,學到的東西可能用得上——當然,如果還來得及的話。既然民主並不能保證決策的正確性,為什麼一定還要追求民主呢?著名哲學家哈耶克說:最為重要的是,民主是一種形成意見的過程。民主的主要優點,並不在於它是一種選舉統治人員的方法,而是在於這樣一個事實:由於大部分人都積极參与了形成意見的活動,所以有相應數量的人員可供遴選。我們可以承認,民主並未將權力置於那些最為明智最為智慧的人士的手中,而且在任何時候,政府的決策若由精英做出,或許能對全體大眾更有助益;但是,上述問題的存在,並不能阻礙我們繼續信奉民主,因為民主的價值是在動態的過程中而非靜態的狀況中得到證明的。與自由相同,民主的利益也只能在長時段中表現出來,儘管在短期中,民主的即時性成就可能不及其他政制(如一個賢明的獨裁者)的成就那麼凸顯。啟示:林肯曾說:「幾乎沒有什麼事情是百分之百好或壞,特別是政府的每項決策都是好壞不可分割的結合,因此要求我們對哪方面佔優勢做出判斷。」完美政治如何實現托馬斯·潘恩寫道:「社會產生於我們的慾望,政府產生於我們的邪惡。社會在各種情況下都是必需的,可政府即使在最好的情況下,也不過是一個無法避免的禍害;在最壞的情況下,就成了無法容忍的禍害。」他的意思是:人要生存,就必須組織一個社會;因為利益衝突導致邪惡行為,所以才不得不建立一個政府來規範。但是這個政府又可能成為產生邪惡的禍患,因此,政府不過是我們為自己無法克服的邪惡付出的代價。如此說來,「完美政治」難道只是一句空話?有沒有可能在未來實現呢?下面的文字是愛因斯坦給巴西一位記者的回信,可以推測,這位記者曾向他提出了關於建立一個美好世界的個人設想。「你的主張我看在原則上是合理的。由少量的人來組織經濟工作,這些人都已被證明有能力,熱情而又無私地願意投身改造生存環境。然而,我不相信你的通過『測試』而選擇的方法,這是一種典型的工程師式的主意,它同你的『人不是機器』的主張不相吻合。」「此外,我想你會考慮這樣一件事:光靠找到十個能人是不夠的——你必須讓世界上的人都服從他們的決定和命令。至於怎樣才能達到這種狀態我拿不出辦法。這個問題要比選出能人來困難得多。在今天的條件下以及在過去存在過的條件下,甚至平庸的人都有可能以某種普遍認可的方式受選。迄今為止,領袖們得到權力主要不是靠他們的思想能力和作決定的能力,而是嘩眾取寵的本領以及靠追隨者們的弱點。」「仍舊是老問題:怎樣才能把權力交到有能力的人手中,交到善良人的手中。這個問題不能解決,一切都無從做起。不幸的是,在我看來,你也沒找到能解決這個難題的途徑。」啟示:「民之所欲,常在我心」只是句口號嗎?你放心把自己的未來交付到不相干的人手上嗎?這和「民主」這個字眼未曾出現在美國憲法與獨立宣言之中,似乎是有異曲同工之妙。第15章 決策的藝術與科學在人們的觀念中,「零和」正在被「雙贏」取代,但是「雙贏」的北後卻蘊藏著更大的危機。對此,我們還沒有找到滿意的應對策略。既然不知道該往何處去,所以要常懷謙遜謹慎之心。「零和遊戲」與「雙贏結局」當你看到兩位對弈者時,你就可以說他們正在玩「零和遊戲」。因為在大多數情況下,總會有一個贏,一個輸,如果我們把獲勝計算為得1分,而輸棋為失1分,那麼,這兩人得分之和就是:1+(-1)=0這正是「零和遊戲」的基本內容:遊戲者有輸有贏,但整個遊戲的總成績永遠為零。「零和遊戲」受到關注,是因為人們發現在社會的方方面面都存在與「零和遊戲」類似的局面,勝利者的光榮背後隱藏著失敗者的辛酸和苦澀。從個人到國家,從政治到經濟,似乎無不驗證了世界正是一個巨大的「零和遊戲場」。這種理論認為,世界是一個封閉的系統,財富、資源、機遇都是有限的,個別人、個別地區和個別國家財富的增加必然意味著對其他人、其他地區和國家的掠奪,這是一個「邪惡進化論」式的弱肉強食的世界。進入20世紀,人類經歷了兩次世界大戰、經濟的高速增長、科技的進步、全球一體化以及日益嚴重的環境污染之後,「零和」觀念正逐漸被「雙贏」所取代,人們認識到「利己」不一定要建立在「損人」的基礎上,通過有效合作,皆大歡喜的結局是可能出現的。「你扒我的口袋,我扒你的口袋」遠不如「你搔我的背,我搔你的背」更可取。然而,在為人類「合作時代」歡呼的同時,我們應注意到,「零和遊戲」在人類生活的許多領域依然適用,而且,當它可能對我們自身有利時,我們也樂於接受它。(股市就是一個很好的例子。人們投資股市,很少是為了獲得投資的回報,而是渴望在炒買炒賣中賺取差額,這樣,當一個人在股市上賺到錢時,意味著別人因此受了損失。)而且,如何在合作中找到各方滿意的方法,並不是一件容易的事。我們距離真正的「合作時代」,還有很長的一段路。啟示:請記住,人是為別人而生存的。人們的精神生活和物質生活都依賴著別人的勞動,人們必須以同樣的分量來報償所領受了的和正在領受的東西。獵人博弈的帕累托優勢設想在古代的一個村莊有兩個獵人。為了簡化問題,假設主要的獵物只有兩種:鹿和兔子。在古代,人類的狩獵手段比較落後,弓箭的威力也有限。在這樣的條件下,我們可以假設,兩個獵人一起去獵鹿,才能獵獲1隻鹿。如果一個獵人單兵作戰,他只能打到4隻兔子。從填飽肚子的角度來說,4隻兔子算管4天吧,1隻鹿卻差不多能夠解決一個月的問題。這樣,兩個人的行為決策就可以寫成以下的博弈形式:要麼分別打兔子,每人得4;要麼合作,每人得10(平分鹿之後的所得)。兩個納什均衡,就是兩個可能的結局。那麼,究竟哪一個會發生呢?是一起去獵鹿還是各自去打兔子呢?這就和情侶博弈一樣,不能完全由納什均衡本身來確定。比較(10,10)和(4,4)兩個納什均衡,明顯的事實是,兩人一起去獵鹿的贏利比各自去打兔子的贏利要大得多。按照長期合作研究的兩位博弈論大師美國的哈薩尼教授和德國的澤爾騰教授的說法,甲乙一起去獵鹿得(10,10)的納什均衡,比兩人各自去打兔子得(4,4)的納什均衡,具有帕累托優勢。獵人博弈的結局,最大可能是具有帕累托優勢的那個納什均衡:甲乙一起去獵鹿得(10,10)。比起(4,4)來,(10,10)不僅是總額的改善,而且每個人都得到很大改善。這就是(10,10)對於(4,4)具有帕累托優勢的意思。關鍵是每個人都得到改善。這裡要解釋一下何謂帕累托效率和帕累托優勢。帕累托(義大利經濟學家)效率準則是:經濟的效率體現於配置社會資源以改善人們的境況,主要看資源是否已經被充分利用。如果資源已經被充分利用,要想再改善我就必須損害你或別的什麼人,要想再改善你就必須損害另外某個人,一句話,要想再改善任何人都必須損害別的人了,這時候就說一個經濟已經實現了帕累托效率。相反,如果還可以在不損害別人的情況下改善任何人,就認為經濟資源尚未充分利用,就不能說已經達到帕累托效率。「大家好,才是真的好」在「獵人博弈」中,兩人合作獵鹿的收益(10,l0)對於分別獵兔(4,4)具有帕累托優勢。這是因為如果比較原來的境況(4,4),現在的(10,10)我們說境況得到了帕累托改善。作為定義,帕累托改善是各方的境況都不受損害的改善。可是上面的情況是假設雙方平均分配獵物,也就是說,兩個獵人的能力和貢獻差不多,但是實際上並不一定如此。如果一個獵人能力強、貢獻大,他就會要求得到較大的一份,這樣分配的結果就可能是(14,6)或(15,5),但有一點是確定的,那就是能力較差的獵人的所得,至少要多於他獨自打獵的收益,否則他就沒有合作的動機。如果合作的結果是(17,3),相對於分別獵兔(4,4)就沒有帕累托優勢,這是因為3比4小,乙受到損害。這樣,我們就不能說境況得到了帕累托改善。雖然17比4多,改善了很多,17+3也比4+4大很多,改善了很多,但是3比4小,乙沒有改善反而惡化。所以站在乙的立場,(17,3)沒有原來的(4,4)那麼好(第一個數代表甲的滿意程度或者得益,第二個數代表乙的滿意程度或者得益)。如果合作的結果如此,那麼,乙一定不願合作。可見,帕累托改善是一種各方都認同的改善,不是要求任何一方作出犧牲的改善。「帕累托效率」很有現實意義,也是目前經濟學家比較關注的問題。著名經濟學家吳敬璉幾年前曾出過一本書,名為《改革正在過大關》,他指的是中國的改革開放到了一個關乎成敗的緊要關頭。改革開放的成就世人共睹,為什麼還要這樣說呢?關於中國的成功有很多分析,有人認為中國的「漸進式」改革,避免了前蘇聯、東歐那樣一步到位的「振蕩療法」或「休克療法」,社會損失較小。深刻一點的分析,則說中國的改革是從體制外的改革開始,向體制內的改革發展等等。人們比較一致的看法是,一直到前幾年為止,中國的改革進程大致上是一種帕累托改善的過程。雖然有一小部分人發了大財,社會不平等程度在增加,但是廣大人民的收人也多多少少在增加,生活基本上都在改善。可是這種改善總要被帕累托效率代替:有些人不可避免地要為社會的發展付出代價。例如目前的國企改革問題。國企效益不好,既有責權不分、經營不善的原因,也是因為計劃經濟下國有經濟一直承擔著「企業辦社會」的重任。企業辦社會,就一定會損失效率。兼辦社會的國有經濟,擔負著為改革開放提供安全網的作用。國有經濟不僅承擔了國家財政收入的絕大部分,而且是億萬職工生計的保證。當私有企業、外資企業等「體制外」經濟輕裝上陣蓬勃發展的時候,國有經濟承擔了國家和政府的許多社會責任。現在,改革已經向縱深發展,突出的問題是國有經濟如何適應市場競爭。當年,因為國有經濟分擔了國家和政府的重任,「摸著石頭過河」的改革開放才得以進行下去。現在,很多「國企」已經在市場競爭中處於劣勢,「辦社會」更是難以為繼。一方面是千萬工人下崗失業,另一方面,社會保障制度又剛剛起步,無法承擔大任。這就造成了儘管社會經濟不斷發展,同時有些人的生活水平卻在下降的「帕累托效率」。顯然,這對維護社會穩定和推動改革的深化是十分不利的。在這種情況下,如何審時度勢進行改革,多種渠道化解社會困難,把非帕累托進程的負面效應控制在最小的範圍,是今後幾年關係中國未來發展走向的關鍵,也正是吳先生所說的「過大關」。啟示:一個在金錢上富足的人,還有心關懷受困於窘境的窮人,才叫真正的富人。豐富的內心是惟一能夠使我們獲得供給的源泉,幸福存在於滿足者的心中。再分配的局限性人們公認,平等是建設一個理想社會的目標之一。許多國家的政府都採用了某種形式的再分配稅制,即富人多繳稅,國家用稅金提高社會福利,這是符合「邊際效用」原則的。「籠中豬」博弈中,大豬所以寧願讓小豬多得益,正是因為它的得益大於成本,而小豬不願這樣做,也是因為成本大於其所得。既然富人從經濟發展中獲益更多,那麼讓他們多承擔一些促進社會福利的事,也很公平。這表現在制度上,就是稅率的差異,收入越高的人,稅率也越高。比如20世紀60年代和70年代,美國所得稅的最高稅率超過70%,而瑞典等北歐「福利國家」就更高。不過,到了20世紀90年代,高稅率的弊端逐漸顯現,因此,許多國家將最高稅率大幅度下調。降低稅率的主要動機,源於高稅收對工作的激勵的損害作用,即努力工作的人並不比遊手好閒的人幸福多少。現在,一方面存在更大的積累財富的激勵,另一方面出現了更大的收入不平等。當然,不平等的背後有很多原因,所得稅只是消除這種癥狀的一個生硬的工具,而不是原因。考慮一下,導致不平等的原因是什麼,而這些原因對設計一個理想的稅制又有什麼影響?實施這一理想體系會有什麼問題?這一體系與現有體系相比有什麼區別?我們從研究導致經濟不平等的一些原因著手。首先是運氣。有兩種運氣。有些人生來就比別人多了某種天才或優勢。即便在這些方面起步平等的人,運氣也會青睞某些人,而不是所有人。許多人以為,運氣產生了某種不平等,這是不公平的,用於平衡這類優勢的稅製得到了廣泛支持。其次是努力。有些人就是比其他人工作更努力。當人們對稅制損害工作的激勵的說法表示同意的時候,他們通常是指提供努力的激勵。假如政府決心抽取相當大一部分的勞動成果,誰還願意努力工作呢?許多人還認為,人們應該有能力保留自己的勞動果實的說法在道義上也是正確的。我們現在假設政府希望做到既能從每一名公民的勞動果實中至少抽取一部分,又不會損害工作的激勵。如果收稅者分辨得出每一個人付出了多大努力,做到這一點當然毫無問題。每個人應該上繳的稅款數目可以直接與他付出的努力掛鉤,變成一個真正意義上的懲罰性的稅制,目標針對那些努力程度未能達到理想水平的人。不過,實際上我們很難對成千上萬工人的努力進行監控。他們可能每天按時上下班,但他們可能漫不經心,從而降低了他們的工作質量,哪怕是制定了非常嚴厲的懲罰措施。人們還發現,要在毫無物質激勵的前提下提高工作質量,簡直難於登天。它使人們陷入一個惡性循環,在前蘇聯,工人中有這樣一句話描述自己和政府:「我們假裝工作;他們假裝支付我們的工資。」20世紀最重要的思想家之一哈耶克指出:絕對的平等是不可能的,一定程度的不平等,不但是應當的,而且是必須的。無論是科技進步、商品生產和生活提高,都不可能是齊頭並進,而是由少數人向多數人的不斷擴展。如果不允許少數人提前享受進步成果,多數人的共同進步也就無從談起。啟示:一位富人曾經這樣說過:即使現在把我全部的財產散盡,我相信過幾年它們還會重新回來。黃金總是閃閃發光——即使在泥土中也是這樣。為什麼「重農抑商」經濟學思想史上,人們對於一個經濟如何才算是有效率的,一直有很不相同的看法。例如孔子的「不患寡,患不均」,就很有代表性,但是大家都知道,只講求平均,很難作為效率的標準。可以說,效率是經濟學中最富爭議的一個概念。古代中國人不知「帕累托效率」為何物,但卻似乎早就將這一法則爛熟於心。一般認為,「重農抑商」思想是阻礙中國社會發展的重要原因之一,可是這一思想中居然也有「帕累托效率」的影子。古人認為:商業只是「五馬換六羊」的交換,商業活動本身不創造任何價值,一些人因商業致富,必然有一些人因商業「致窮」,這也就是為什麼商人在中國總是和「為富不仁」、「巧取豪奪」之類的負面形象聯繫在一起,中國人的「仇富」心理如此普遍的原因。當然,我們現在知道商業活動是能夠創造價值的:增加就業機會、促進生產和消費(如一個獵人在沒有商業活動的情況下,他每天打獵的成果只要夠果腹就行了,打得多了也只能白白爛掉,如果有一個市場,他就可以把多餘的獵物賣掉,換成錢再買別的東西)、有助實現資源的優化配置等。但是這些只說明我們的社會還有發展空間,還沒有達到「帕累托效率」。所以說,古人的擔憂不是沒有道理,只是擔憂得早了一點。啟示:「杞人憂天」為人所笑,但是我們或許笑得也太早了一點。現代社會建立在不斷發展上,是不是必需?是不是應該?是不是該在某個時候停下來?誰也不知道。哈丁公用地悲劇既然「公平」難免損害效率,為了避免帕累托效率的影響,似乎惟一的出路就是「開源」:通過經濟發展、技術進步「把蛋糕做大」實現帕累托改善,可是一方面,這只是緩解了、而不是解決了帕累托效率問題,另一方面,它又把我們帶進了一個更大的麻煩——公用地悲劇。美國學者哈丁在一篇重要而具有影響力的文章里提到,不加限制的個人選擇可能給社會帶來災難。哈丁舉了這樣一個具體事例:一群牧民面對向他們開放的草地,每一個牧民都想多養一頭牛,因為多養一頭牛增加的收益大於其購養成本,是合算的,儘管因平均草量下降,增加一頭牛可能使整個牧區的牛的單位收益下降。每個牧民都可能多增加幾頭牛,草地將可能被過度放牧,從而不能滿足牛的食量,致使所有牧民的牛均餓死。這就是公共資源的悲劇。悲劇在於每一個人都陷入了一個體系而不能自拔,這個體系迫使他在一個有限的世界裡無限地增加自己的牲畜。在一個信仰平民自由的社會,每一個人都在追求自己的最大利益,從而毀滅將成為大家不能逃脫的命運。他按照這一思路討論了人口爆炸、污染、過度捕撈和不可再生資源的消耗等問題。他的結論是,世界各地的人民必須意識到有必要限制個人作出這些選擇的自由,接受某種「一致贊成的共同約束」。對公共資源的悲劇有許多解決辦法,哈丁說,我們可以將之賣掉,使之成為私有財產,可以作為公共財產保留,但准許進入,這種准許可以以多種方式來進行。哈丁說,這些意見均合理,也均有可反駁的地方,「但是我們必須選擇,否則我們就等於認同了公共地的毀滅,只能在國家公園裡回憶它們了。」哈丁說,像公共草地、人口過度增長、武器競賽這樣的困境「沒有技術的解決途徑」,所謂技術的解決途徑,指「僅在自然科學中的技術的變化,而很少要求或不要求人類價值或道德觀念的轉變」。對公用地悲劇的防止有兩種辦法:一是制度上的,即建立中心化的權力機構,無論這種權力機構是公共的還是私人的——私人對公用地的擁有即處置便是在使用權力;第二種便是道德約束,道德約束與非中心化的獎懲聯繫在一起。「看不見的手」有多長現在,請你確定這個問題的本質。試試把這個問題跟我們在前面提到的一個或多個例子掛鉤,然後你就能找出幾個可供選擇的解決方案,再對這些解決方案作一個評價。不同情況下,公用地悲劇可能成為一個多人囚徒困境(每一個人都養了太多的牛)或一個超出負荷問題(太多人都想做畜牧者)。經濟學家最喜歡的解決方案是確立產權。這也是十五六世紀在英格蘭真實出現的事情:公有土地被圍起來,落入當地貴族或地主手裡。一旦土地成為私有財產,那隻「看不見的手」就會恰到好處地關上大門。主人可以收取放牧費,使其租金收入最大化,而減少對土地的使用。此舉改善了整體經濟效率,卻同時也改變了收入的分配:放牧費使主人更富有,使牧人更貧窮。這一規定在其他場合併不適用。公海的產權很難在缺少一個國際政府的前提下確定和執行,控制攜帶污染物的空氣從一個國家飄向另一個國家也是一個難題。基於同樣的理由,捕鯨和酸雨問題都要藉助更直接的控制才能處理,但建立一個必要的國際協議卻很不容易。有時候,假如集團規模足夠小,自願合作可以解決這個問題。若有兩家石油或天然氣生產商的油井鑽到了同一片地下油田,兩家都有提高自己的開採速度、搶先奪取更大份額的激勵。假如兩家都這麼做,過度的開採實際上可能降低它們可以從這片油田收穫的數量。鑽探者意識到了這個問題,看上去也有辦法達成分享產量的協議。但是,在一個規模較大的集團里,達成這樣的協議不但非常困難,而且也很難得到完全的遵守。啟示:正如哈丁提到的那樣,人口是一個甚至更加艱巨的難題。決定要幾個孩子,似乎是做父母的個人自由,但是如果人們都傾向於多生小孩,就會造成人口爆炸的危機。現在很多人已經認識到:生育不是一種自由,而是有限的權利。公共品供給的「囚徒困境」公共品和私人品的性質很不一樣。私人品是私有私用,除了像他穿得整齊你看著也舒坦那樣十分間接的效應以外,別人很難沾什麼光。公共品則不一樣,一旦不管是誰提供出來,許多人都可以享用。比如路燈,只要有人裝了,路人都將得到好處,哪怕他沒有為此貢獻過一分錢。設想農村某地有一個只有兩戶人家的小居民點,由於道路情況不好,與外界的交通比較困難。如果修一條路出去,每家都能得到「3」那麼多好處,但是修路的成本相當於「4」。要是沒有人協調,張三、李四各自打是否修路的小算盤,那麼兩家博弈的形勢如下:如果兩家聯合修路,每家分攤成本「2」,各得好處「3」,兩家的純「贏利」都是「l」;如果一家修另一家坐享其成,修路的一家付出「4」而得到「3」,「贏利」是「-1」,坐享其成的一家可以白白贏利「3」(假設修路的並沒有路的地權,他總不能因為修了路就不讓鄰居走);如果兩家都不修路,結果兩家的贏利都是「0」。在這個博弈中,修路是張三的嚴格劣勢策略,我們應該把它消去;修路也是李四的嚴格劣勢策略,所以也應該把它消去。這樣運用嚴格劣勢策略消去法,我們就得到這個博弈的嚴格優勢策略均衡:兩家都不動手,大家都得零。一般來說,鄉下地方如果張三隻有李四一家鄰居,李四隻有張三一家鄰居,他們多半會守望相助,關係比較好。這樣的兩家自然會好好商量修路的問題,一起把路修好,大家都得到好處。相反,兩家有仇也是可能的,那就麻煩了,不是什麼修路不修路的問題,遲早要出事。但是,博弈論討論所牽涉的局中人,都是經濟學上所講的「理性人」,他們只為己,但是並不刻意害人。現在城市公寓裡面的不少居民在鄰居關係上,有時候差不多就是這種理性人的關係。對於他們來說,都市化進程的一個副產品,就是即使是近鄰也形同陌路。如果沒有公寓物業管理方面的制度安排的話,新公寓家家裝修一流,可是樓道就雜亂無章,常常還陰暗得很。路燈壞了,往往長久沒有人修理。修路燈也和修道路一樣,是一個大家都袖手旁觀才是「嚴格優勢策略均衡」的博弈。這就是公共品供給的囚徒困境:如果大家都只從自己得益多少考慮問題,大家都只打自己的小算盤,結果就誰也不作為,對局鎖定在「三個和尚沒水吃」的局面,排除了合作雙贏的前景。所以,公共品問題一定要有人協調和管理。就一個國家來說,最重要的公共品是國防、教育、基礎設施和其他政府部門。政府責無旁貸,要用好來自納稅人的錢,把文化教育、社會保障、基礎設施和國防公安等事情做好。機關大院、居民小區要有專人協調管理,把身邊看起來很瑣碎但是弄不好有損工作條件和生活環境的事情做好。啟示:古人講究「修身齊家治國平天下」,似乎是從小到大一樣的邏輯。其實,人們對待「家事」和「國事」的邏輯並不一樣,原因很簡單:「修身齊家」的好處是可見的,而「治國平天下」的好處就不那麼清晰可見了。「好人好報」前面我們講過帕累托效率的概念:如果資源已經被充分利用,要想再改善某些人的處境就必須損害其他人了,就說這個經濟已經實現了帕累托效率,或者說已經達到了帕累托最優。博弈說明,非合作博弈的結局常常不是帕累托最優的。這種情況的博弈雖然只有兩個局中人,但是它的結局其實就是「三個和尚沒水喝」的結局。事實上,兩人博弈也能說明不少「多人博弈」的前景。三個和尚沒水喝的局面是可以作帕累托改善的:設想有人協調一下,安排一個輪流挑水或抬水的制度,三個和尚的處境都會得到改善。如果用「帕累托改善」來看社會公德(這也是一種「公共資源」)建設,我們會發現一些值得深思的問題。做好事該不該要報償?在我們的印象里,傳統文化是恥於談錢的,一個行善的人,就是品德高尚的人,這樣的人就應該是重義輕利的。但是經濟學家不這麼看。他們認為:做好事就是促進人群福利的行為(經濟學稱之為「有效率的」行為),這種行為不但應該鼓勵,而且必須鼓勵。只有這樣,才會不斷促進社會福利的提高。怎麼鼓勵呢?人都是自私的,總要追求自身的利益,所以給予報償是最有效的。這聽起來好像叫人不太舒服,其實,中國人的「道德宗師」孔子在兩千年前,就提出過這一問題。春秋時期,魯國有這樣一條法律:如果魯國人在其他國家中遇見淪為奴隸的魯國人,可以墊錢把這個奴隸贖出來,回國後再到國庫去報銷。孔子的弟子子貢曾花錢贖出一個已淪為奴隸的魯國人,但事後並不到國庫去報賬,以顯示自己追求仁義的決心與真誠。孔子知道此事後,對子貢說:我知道你追求高尚,也不缺錢花,可是這個補償你一定要去領。因為你自己掏錢救人,會受到社會的讚揚,但今後,當別人在國外再遇見淪為奴隸的魯國人時,他就會想墊不墊錢去贖人?如果墊錢贖了人,回國後去不去報賬?不去報賬,豈不是白白丟掉一大筆錢;如果去報賬,豈不是在行為上會遭旁人譏笑,顯得自己的品格不高?於是就會裝做沒有看見,這樣一來,你的高尚行為豈不是阻礙了對至今仍淪為奴隸的魯國人的解救?如果德行善舉得不到報償,那麼它就只能是少數人的「專利」而不會成為社會公德。以職業道德為例:改革開放以前,儘管輿論大力宣傳一些各行各業的勞模、先進人物的事迹,但整個社會的職業道德水平卻很低,營業員申斥顧客、工人消極怠工之類的現象很普遍。隨著市場經濟的建立,儘管有人感嘆拜金主義對傳統道德造成了衝擊,但不可否認,社會職業道德水平在不斷提高,作為消費者,我們可以享受微笑服務而不必到處生氣了。不要小看這些,更不要因為這些微笑「只是為了賺錢」而斥之為虛偽,消費者和商家都能獲益,這才是真實、穩定的「雙贏」。相反,如果肯對你微笑的只有「毫不利己,專門利人」的聖賢才是值得憂慮的,天下攘攘,能有幾個聖賢呢?啟示:傳說孔子的另一位弟子有一次見到有人掉在水裡,他跳下水去,把遇難者救上岸來,被救者酬謝這位弟子一頭牛,他收下了。孔子對這個學生的行為大加讚賞。就是因為這會激勵更多的人去救人,將會使今後有更多的溺水者受到營救。用什麼減少垃圾垃圾已經成了令人頭疼的問題。這世界上的大多數城市,都處於垃圾的包圍中。這些垃圾都是城市製造的,要說自作自受,那是一點也不錯。可是我們不是消極厭世者,不是憤世嫉俗者,我們希望找到一個對付垃圾的好辦法。這個問題可以分為兩個方面:開源和節流。一是如何處理已有的垃圾,二是如何減少垃圾的生產。前者可以通過技術手段完成,後者呢?容易想到的辦法是:加強環保教育,使人民認識到垃圾的危害性;同時逐漸減少不可回收物品(如塑料袋、發泡餐盒等)的使用,代之以可回收和降解的產品。可是這兩個措施的收效並不理想。正如我們前面討論過的,如果沒有其他手段作為保證,思想教育很難改變人們的固有生活方式。而可回收和降解的產品因為成本較高,也難以替代不可回收的產品。較為明智的固體廢棄物減量方式,最好是通過簡單的市場力量來運作:採用污染者付費的原則,讓製造垃圾較多的民眾付出較高的代價。美國西雅圖市在減少居民的固體廢棄物丟棄量方面提供了成功的經驗。在西雅圖,居民可自行決定每星期使用的是19、32或60加侖容量的垃圾桶。每種垃圾桶的月費,以及增加任何一種垃圾桶的費用,都是隨著容量呈幾何級數增加,以便於杜絕隨意浪費。同時,西雅圖還另備有可再生物品專用容器,而且不收處理費用。當西雅圖在1981年剛啟用這套系統之時,平均每戶一星期的垃圾都會裝滿三個半32加侖的垃圾桶,目前則已降低到每星期平均只有稍多於一個32加侖垃圾桶的垃圾量。西雅圖的計劃之所以能奏效,是因為這套計劃不但簡明扼要,而且借用了經濟誘因的力量來推廣垃圾減量及再生。他們並沒有直接告訴民眾該如何改變生活方式,換言之,他們並沒試圖去顛覆民眾的生活方式,或是對他們採取一視同仁的平頭處理方式;相反的,這項計劃提供了改變生活方式的原因,允許民眾自行決定該不該改變、該做多大改變。換言之,它等於是說:這是我們的規則,你們自己看著辦吧。啟示:在這裡要提醒大家:「可降解」可能只是一個理想,根據兩個美國記者的調查,被埋在垃圾場里的多數物品實際上都「不可降解」:埋了十幾年的報紙、衣物甚至熱狗,大體上還是原來的模樣。沙塵暴的警示我們有時在電視中看到沙塵暴,那種難分晝夜、日月無光的情景很讓人心寒。特別是當這種景象發生在像北京這樣重要的城市時,總能聽到人們的驚呼:生態警鐘敲響了!河北境內的沙漠直逼北京,據說最近的沙漠離北京只有60公里。專家預測,如不想出有效辦法對沙漠進行治理,幾十年後,北京將像消失的樓蘭古城一樣,被沙漠掩蓋。土地荒漠化是中國重大的生態問題,而且荒漠化的速度還在呈上升趨勢。上世紀50年代至70年代中期年均擴大1560平方公里,而在70年代中期到80年代中期年均擴大面積為2100平方公里,而目前的擴大速度為每年2460平方公里。這個速度還在增加。中國土地的荒漠化集中在中國的西部和北部,即內蒙、新疆、黑龍江、寧夏等省份。在北方,雨水量小,土地上的生態系統脆弱,為了維持過度增長的人口對糧食等的需求,人們對土地的索取呈加速趨勢。對土地的「濫墾」、「濫牧」、「濫伐」、「濫采」是土地沙漠化的原因。據調查,在牧區,草原上的牲畜嚴重超載已成普遍現象,牧區一般超載50%~120%,有的地區達到300%。那麼是不是這些地方的人民都愚昧無知或貪得無厭呢?我們可以看到,荒漠化最嚴重的地區,恰恰是中國最貧困的地區。人民脫貧致富的要求是合理的,同時他們所生產的原料(羊毛、牛奶等)大部分是供應東南部較富裕的地區的。所以說,土地荒漠化不是某個地區的問題,而是整個國家的問題。在世界環境危機中也有同樣的問題,由於環境破壞的情況主要集中在發展中國家,富國就把矛頭指向窮國,要求它們保護環境,不要為了自己的私利而損害公共利益。可是發展中國家指出,環境破壞的最大收益者正是發達國家,它們理應為環境問題「埋單」。啟示:現在普遍同意的觀點是,荒漠化的原因,是由於人類對土地資源的過度利用——對土地的利用超過了它的承受能力。喪鐘為誰而鳴現在各國都在發展經濟,GDP(國民收入)是一國富裕程度的指標,或者說是國力強弱的指標,各個國家都在制定促使GDP增長的政策。然而,某些國家的GDP的增長在一定程度上建立在對自然的破壞之上,可以這麼說,在某些國家和地區,GDP是對自然破壞的指標。當然,有很多人會問:為什麼美國那麼富裕,而對自然破壞得較少?的確,美國的環境是保護得最好的。其實,這有三個原因:第一,美國生產或消耗的原料有很大一部分來自於別國,如石油來自中東,美國GDP的增長建立在他國對自然的破壞之上;第二,美國的產品許多是高科技產品,高科技產品對自然的破壞較輕,但它會加大人類對自然的破壞力量;第三,美國生產的高科技產品往往難以被自然消解,自然對加工粗糙的產品的消解是容易的,而對用高科技製造出來的精巧的物品消解起來是緩慢的,所以這種對自然的破壞不是那樣直觀,因此常被我們忽略。可以這麼認為,人類文明的發展是不可拒絕的。當周邊國家進入工業社會,發展機器工業,可以在較短的時間生產出比農業社會較多的物資,並且可以生產出以前沒有的東西,有哪個國家看到這種情形還會無動於衷?即使你情願做「小國寡民」,周邊國家的強盛也必然會使你的安全受到威脅,因此,除了被動地跟進,你沒有其他選擇。17世紀工業革命首先發生在英國,西方國家相繼進入工業社會。而遠東的中國,在距離上離發生工業革命的西歐較遠,因而在時間上也直到19世紀中葉才感受到工業革命的衝擊——在列強槍炮的攻擊下被動地接受工業化。20世紀的中國其實是被動地接受現代化。在社會發展史上人們在很大程度上是沒有多少選擇餘地的。我們這裡要說的不是歷史的發展規律問題,而是要表明:當前世界各國競相發展經濟、對自然進行破壞,是一個集體行動的悲劇。發展經濟對人類確實是好事,但問題是,經濟的發展空間不可能是無限的,不妨說,市場經濟是促進人類發展的火車頭,但是這個車頭卻沒有一個有效的剎車系統。市場經濟是競爭經濟,在這樣一個優勝劣汰的格局下,拚命地向自然索取或者說掠奪是現時代的特徵。每個競爭者——可以小到個人,大到國家——都這樣想:我不發展就有可能被淘汰出局。而經濟的發展就是對自然的利用——無論這種利用是對自然中原始物的加工還是對中間產品的再加工,其結果都是自然被加速地破壞。這就是自然的生態狀態愈來愈惡化的原因,其結果是人類的生存環境越來越惡劣。這就是悲劇:大家都意識到問題所在,但大家都無能為力。啟示:許多人清楚人類目前的這種狀況,但誰也沒有良藥,因為「破壞——發展」是優勢策略,每個參與者採取「破壞——發展」成為集體行動的納什均衡。目光短淺,或在劫難逃現在很多人已經承認:人類的發展不是無限的,越來越嚴重的環境問題就是證明。換言之,「帕累托改善」(所有人受益)總要達到「帕累托效率」(有些人受益,有些人吃虧)。人們都希望生活改善,而沒有人希望生活水平下降,這是人之常情。但這似乎是不可能的。發展中國家以發達國家為目標,發達國家也不希望停步不前(更不要說倒退了),有沒有「發展的極限」?如果有,它在哪裡?美國人口將近3億,佔世界人口的5%,卻消耗世界30%以上的資源。這當然不公平,但是如何實現公平,確實令人頭疼。每個國家、每個人都有權追求更快的發展、更高的生活品質,但是如果再增加幾億人達到美國人的生活水平,這個世界就無法承擔。結果是環境遭到毀滅性破壞,資源枯竭,人類的生存都要面臨問題,談何發展?看來,惟一的解決辦法是富國降低生活水平,給窮國讓出部分「蛋糕」。正如「籠中豬」博弈所演示的那樣,富國一方面在環境保護和治理方面承擔更多的義務,一方面遏制發展的慾望,給窮國讓路。可是,即使真有政治家看到了這一點,他也無法贏得大選,實現這一理想。誰會選一個許諾「明天會更糟」的人呢?「帕累托改善」不可能,「帕累托效率」又會遭到既得利益者的反對,人類的未來的確值得憂慮。莫非只有等到「天塌砸眾人」?惟一的希望在於在危機到來之前,人們找到一個合理的、各方認可的妥協方法,可問題是:還有多少時間?還有多少機會?啟示:美國拒絕在《京都議定書》上簽字,就是這個道理。儘管簽署這一協定,長久而言對大家(包括美國自己)都有好處。這也是「囚徒困境」:每個人的最佳選擇,導致最壞的結果。世界政府既然各自為政的國家無法就這類全球性問題達成一致,那麼一個「世界政府」(聯合國不是一個權力機構,只是一個協調機構)能否解決這個難題?這裡有兩個問題,一是能不能,二是好不好。先看第一個:一個凌駕於國家之上的「世界政府」可能建立嗎?今日的世界著實叫人眼花繚亂,一方面,很多國家分崩離析,如前蘇聯、南斯拉夫等國家的分裂,在另外一些國家,分離主義也在抬頭;另一方面卻是全球經濟、政治的一體化進程。歐洲議會已經成立,並將產生歐洲憲法,可以想像,未來歐洲將以一個類似國家的統一面目發揮作用。同時北美、東亞、南亞和非洲都開始成立或謀求成立自由貿易區,而經濟的一體化肯定會對政治一體化起到推動作用。不妨這樣說,分裂是「清算過去」,而統一是「面向未來」,「過去」總有清算完結的一天,而未來的巨大利益,必將成為「天下一家」的推動力。即使各方文化、利益的衝突不可調和,一時無法成立一個天下一統的政體,至少出現幾大國家集團的前景是可以預見的。再看第二個問題:「世界政府」應該建立嗎?一個世界政府可能給人類帶來諸多好處,如可以在整體上解決核威脅、資源調配和環境危機等全球性問題,大大降低交易成本,人們有更多的自由和選擇。可是它也有很多問題:它對各國的領導權是建立在暴力手段上嗎?如何調節各地區、國家間的矛盾?用什麼手段保證這個集權政體避免獨裁?集權導致腐敗,這是人類歷史已經證明的「定理」。一個獨立國家的獨裁者要面對國際競爭的壓力——如果他做得太過分,就可能導致國弱民窮,國家失去競爭力。可是假如沒有外星人入侵之類的外部威脅,一個全球政府的外部壓力又在哪裡呢?如果希望通過「內部壓力」——民主防止獨裁,又如何解決內部權力鬥爭導致的效率低下?也許比較可能的前景,還是若干「超級大國」並存,相互既合作又鬥爭的博弈局面,這當然不能從根本上解決問題,但有助於簡化問題,找到比較可能為各方接受的辦法。可是這會不會又導致新的問題出現?一個答案往往是下一個問題,也許我們只能走一步看一步。你也許已經發現一個悖論:解決公用地悲劇的方法(通過私有化使人們從保護中獲得利益)卻是更大的公用地悲劇的根源(個人和國家追逐利益,破壞地球環境)。這其實也並不奇怪,「人類社會學三定律」其中有這樣一條:一個系統內的解決之道,將成為更大系統的難題。這不僅是對博弈論的考驗,更是對人類智慧的考驗。啟示:你也許已經發現一個悖論:解決公用地悲劇的方法(通過私有化使人們從保護中獲得利益)卻是更大的公用地悲劇的根源(個人和國家追逐利益,破壞地球環境)。這其實也並不奇怪,「人類社會學三定律」其中有這樣一條:一個系統內的解決之道,將成為更大系統的難題。尾聲什麼是最佳策略故此,爾等須知曉自身宿命,故此,爾等須把穩船隻……置欲求於動機之後,爾須奮力以搏。故此,且容好奇心為爾等指南。追尋天上真理,如同在大地尋覓。所不敢為者,為之;所不敢至者,往之。道路千萬條,宜選陽光道。聰明擇路,正派為人,公平行事。故此,爾須多有智識,勤於創造。——《愛因斯坦的聖經》很抱歉,這本談策略的書要以佈道告終。但是正如我們看到的:好多人失敗,不是因為他們傻,而是太聰明。一個聰明人的麻煩是他總希望比別人多得一些,或者說,他總面臨這樣做的誘惑。因為他比別人聰明,他是有能力這樣做的,按照我們對人性的了解,人普遍追求利益的最大化,聰明人這樣做,也是很自然的。然而,這種自然的行為卻引起了一系列無法控制的變化,其中最關鍵的就是:生活越來越複雜了。比如,你要做成一件事情,希望達到某種目的,但是你不能僅僅考慮這件事本身,還要考慮它可能造成的各種影響。要不要與人合作?利益如何分配?它會不會得罪某些人?等等。你不得不考慮它們,因為這些問題確實存在。這樣你就不得不花費大量的精力和智慧去處理它們,而這些花費對你本來想做的那件事並無多大益處。也就是說,它們大大提高了你做事的成本。這種多餘的花費似乎是我們的宿命。如果大家都考慮得少一點,都傻一點,不是對每個人都好嗎?所有美好的東西都是傻子創造的:埋頭苦幹的是傻子,助人為樂的是傻子,推己及人的是傻子,滿懷希望的還是傻子,傻子創造了世界,傻子享有世界。很遺憾,我們已經懂得,世界不會因願望(不管多麼良好,多麼合理)而改變,「傻子」在這個世界一定是無法生存的,因為在一個資源稀缺的世界,可以說「利他」的機會成本就是「損己」,而「損己」的極至便是讓出你的生存空間給別人。但是,我們還是有可能改變一些東西的,只要你懂得:聰明可能並不像看起來那樣聰明,傻也不像看起來那樣傻。「囚徒困境」中,人們越聰明,結果越糟糕。而打破這一困境的辦法很簡單:一報還一報。也就是所謂「人不犯我,我不犯人;人若犯我,我必犯人」。它能夠清晰表明我們的立場,用最明了的方式告訴對方:為了自己的利益,他該怎樣去做。從「一報還一報」的勝利中,我們可以得到以下結論:你的策略越簡單,越清晰,也就越有效。相反,如果你的策略無原則的複雜,將永遠面臨考驗。書店裡有很多書指導你如何生活、如何與人相處、如何應付這樣那樣的問題,雜誌上也連篇累牘地告訴你如何說話、如何察言觀色、如何八面玲瓏。不用說,這些人生指南常常是相互矛盾,甚至是自相矛盾的。你應該誠實,但又不能太老實;你應該友善,但也要偶爾發發脾氣;你應該能幹,但又不要弄到被別人嫉妒的地步;你應該聰明,但要裝得傻一點;你要討領導的歡心,但不要被認為是個馬屁精;你要多交朋友,但未可全拋一片心……即使你沒讓這些東西弄糊塗,也不免感到,想好好活下來真是不容易,你得學會踩鋼絲才行。人生有無數答案,我們很難確知哪個最標準。如果你想把答案弄得很複雜,那是你的權利,但不是惟一的解決之道,其實你也完全可以用簡單的方法對付它,那就是:不管周圍如何,你為自己制定幾條原則,並照此行事。這很愚蠢嗎?其實未必。環境是無法選擇的,也是無法完全控制的,你在上面花費的心思,就不一定划算。因此,我們再次重複強調一些通則,不過這麼做有點兒冒險,因為人們傾向於過度簡化生活,尤其是在這個頭條標題取代新聞、記錄片取代真實故事、書摘取代書籍的年代裡更是如此。所以別忘了另外兩句沒有列入這些通則中的話:懷疑是權利的保證;要「拿來」,不要「接受」。策略的優劣,取決於遊戲規則。個人的最佳策略是儘可能利用規則,社會的最佳策略是通過規則引導人們的行為趨向群體福利的提高。對合作或冒犯,都要給予回報。「以德報德,以直報怨」。如果你懲罰對方的報復,這種反應就會一直延續下去。如果你寬恕了對方,你就得冒被欺負的風險。不要把贏作為惟一目標,也不要總是追求最好結果。在許多類似「囚徒困境」的博弈中,雙方的關係並不是簡單的「你贏我輸」的對抗關係。雙方可以都做得很好,也可能都做得很糟。制勝不是靠打擊對方、壓倒對方,而是靠引導對方採取對雙方都有利的行為,即合作的行為。如果有幾種選擇,選擇最直的路。清晰、簡單、有連續性、讓合作方明白易懂的策略往往是最優的。公開聲明自己所持的態度,並在任何時間、任何利益誘惑下都始終如一地堅持下去,才會使自己立於不敗之地。朝令夕改會令對方無所適從。複雜的規則並不比簡單的規則做得更好。你不可能永遠控制局面,也不必永遠控制局面,人類最理智的時候,往往是別無選擇的時候。知識就是力量。至少在某些情況下,擁有一定程度的知識對理性決策助益匪淺,而且知道得越多,你的決策就越可能接近正確。在博弈中,你的地位常常取決於你是否擁有信息並在此基礎上作出理性決策。各種層次、領域的決策都可以通過知識的增長而改善。除非能在一開始就很清楚自己的既定目標,或想要避免的事,不然永遠無法作出理性決策。這適用於個人與團體決策,只是對後者而言,顯然困難得多。如果能同時設定可能後果的價值,不論正負,再加上發生的機率,就更能幫你做不理智的抉擇。即使是全然理性的決策也可能是錯的,反之亦然。因此,若結果出乎意外地糟,也沒有必要自責或自暴自棄;同樣地,如果運氣好,結果也不錯,更不必沾沾自喜。如果是不確定的,那就是不確定,你只能與機運鬥法,但若能以智慧來與機運抗衡,則獲勝的機會就會比失敗大出許多。無論你想做什麼,不管是賭博、運動、投資股市、擇偶,甚或發動戰爭,之前你最好弄清楚自己在做什麼。合作與雙贏並不意味著完全的公平。所有好的策略,都不過是在公平與效率之間找平衡。註定會產生壞決策的一個方法,就是把決策者和受益者分離,決定人和被決定人分開;雖然一般人大談對社會福利的關切,但這種關切只有在和個人利益沒有切身關係時才看得到;一旦社會福利造成個人損失,利他主義就消失了。團體決策基本上比個人決策更難保持理性,在團體決策過程中有很大的操弄和使詐的空間。目前已知的各種選舉制度都無法避免這個現象,只不過有些制度的表現比較好而已。至今仍找不到令人滿意的方法,能在不產生不良結果的情形下,同時順利地把各人偏好轉換成團體偏好。阿羅不可能原理告訴我們:任何制度都有缺陷,而最好的制度就是造成損害最少的制度。內耗不可避免,明智的人把內耗控制在可接受的限度內。據此推論,「若每個人的行為都以理性的自利為出發點,則其結果仍會對社會有利」,這個樂觀想法仍舊是個誤區。更不幸的是,它反而掩飾了無知自利的影響。再以此推論,至今人類仍未發明出一種政府形態,完全令人滿意、可以作出造福社會的團體決策。我們真的不知道該往何處去,所以要常懷謙遜之心。評論博弈論」不是「大力丸」「博弈論」不是「大力丸」作者:摸魚兒現在,「博弈論」正在成為一門「顯學」,坊間這類著作頗多。對於普通讀者來說,《博弈遊戲》似乎是個不錯的選擇。「博弈」這個詞聽起來高深莫測,其實它就是「遊戲」的意思。如果直譯就是「遊戲理論」。更準確點說,是可以分出勝負的遊戲。我們生活在這個世界上,就不可避免地要與他人打交道,這是一個利益交換的過程,也就無可避免地要面對各種矛盾和衝突。所謂博弈論,簡單說來就是研究在這種背景下,人們如何進行決策、以及這種決策的如何達到均衡問題。每個對弈者在決定採取何種行動時,都必須考慮到他的決策行為對其他人的可能影響,以及其他人的反應行為的可能後果,通過選擇最佳行動計劃,來尋求收益或效用的最大化。可以說,只要你是一個「社會人」,你就離不開博弈論。關於「生活智慧」的著作大致可分兩種:一是「照方抓藥」式的,告訴你在某種情況下應該怎麼做;二是「思想教育」式,從林林總總的生活現象總結一般規律,並以此指導生活中的種種選擇。前者之弊在於淺陋,後者之弊在於空泛。這本書比較好地避免了這兩種陷阱:它介紹了許多特定情況下的決策原則,但並不是什麼「策略大全」;它告訴讀者:人們在進行選擇時遵循的一般規律,但都言之有物。「深入淺出」也是本書的一個特點:它擯棄了同類作品中常見的(同時也是令讀者望而卻步的)圖表、公式等「專業」模式,而是通過一些有趣的例子和謎題(如「囚犯困境」、「約會遊戲」、「槍手決鬥」、「強盜分金」等)解釋生活中的種種現象,告訴你為什麼有時我們會在優勢情況下輸掉比賽;為什麼群體理性決策如此困難;為什麼社會公德難以提高,為什麼「聰明人」不象他看起來那樣聰明……這些揭示都不是流於表面的、情緒化的和止於道德判斷的,而是通過清晰、客觀的分析,讓我們理解人們思想和行動的邏輯。如同許多理性而誠實的著作一樣,本書並沒有給我們一個「包治一切」的現成的「答案」(儘管它提供了許多很有啟發性的思考方式和選擇原則),而是指出我們理性的並不完美。在這個問題成堆的世界上,單純地「予智自雄」或「以力壓人」都終非坦途,我們只有懷著謙遜、合作的態度,才可能取得比較理想的結果。納什與博弈論1950年和1951年納什的兩篇關於非合作博弈論的重要論文,徹底改變了人們對競爭和市場的看法。他證明了非合作博弈及其均衡解,並證明了均衡解的存在性,即著名的納什均衡。從而揭示了博弈均衡與經濟均衡的內在聯繫。納什的研究奠定了現代非合作博弈論的基石,後來的博弈論研究基本上都沿著這條主線展開的。然而,納什天才的發現卻遭到馮·諾依曼的斷然否定,在此之前他還受到愛因斯坦的冷遇。但是骨子裡挑戰權威、藐視權威的本性,使納什堅持了自己的觀點,終成一代大師。要不是30多年的嚴重精神病折磨,恐怕他早已站在諾貝爾獎的領獎台上了,而且也絕不會與其他人分享這一殊榮。納什是一個非常天才的數學家,他的主要貢獻是1950至1951年在普林斯頓讀博士學位時做出的。然而,他的天才發現——非合作博弈的均衡,即「納什均衡」並不是一帆順的。1948年納什到普林斯頓大學讀數學系的博士。那一年他還不到20歲。當時普林斯頓可謂人傑地靈,大師如雲。愛因斯坦、馮·諾依曼、列夫謝茨(數學系主任)、阿爾伯特·塔克、阿倫佐·切奇、哈羅德·庫恩、諾爾曼·斯蒂恩羅德、埃爾夫·福克斯……等全都在這裡。博弈論主要是由馮·諾依曼(1903—1957)創所立的。他是一位出生於匈牙利的天才的數學家。他不僅創立了經濟博弈論,而且發明了計算機。早在20世紀初,塞梅魯(Zermelo)、鮑羅(Borel)和馮·諾伊曼已經開始研究博弈的準確的數學表達,直到1939年,馮·諾依曼遇到經濟學家奧斯卡·摩根斯特恩(Oskar Morgenstern),並與其合作才使博弈論進入經濟學的廣闊領域。1944年他與奧斯卡·摩根斯特恩合著的巨作《博弈論與經濟行為》出版,標誌著現代系統博弈理論的的初步形成。儘管對具有博弈性質的問題的研究可以追溯到19世紀甚至更早。例如,1838年古諾(Cournot)簡單雙寡頭壟斷博弈;1883年伯特蘭和1925年艾奇沃奇思研究了兩個寡頭的產量與價格壟斷;2000多年前中國著名軍事家孫武的後代孫臏利用博弈論方法幫助田忌賽馬取勝等等都屬於早期博弈論的萌芽,其特點是零星的,片斷的研究,帶有很大的偶然性,很不系統。馮·諾依曼和摩根斯特恩的《博弈論與經濟行為》一書中提出的標準型、擴展型和合作型博弈模型解的概念和分析方法,奠定了這門學科的理論基礎。合作型博弈在20世紀50年代達到了巔峰期。然而,諾依曼的博弈論的局限性也日益暴露出來,由於它過於抽象,使應用範圍受到很大限制,在很長時間裡,人們對博弈論的研究知之甚少,只是少數數學家的專利,所以,影響力很有限。正是在這個時候,非合作博弈——「納什均衡」應運而生了,它標誌著博弈論的新時代的開始!納什不是一個按部就班的學生,他經常曠課。據他的同學們回憶,他們根本想不起來曾經什麼時候和納什一起完完整整地上過一門必修課,但納什爭辯說,至少上過斯蒂恩羅德的代數拓撲學。斯蒂恩羅德恰恰是這門學科的創立者,可是,沒上幾次課,納什就認定這門課不符合他的口味。於是,又走人了。然而,納什畢竟是一位英才天縱的非凡人物,他廣泛涉獵數學王國的每一個分支,如拓撲學、代數幾何學、邏輯學、博弈論等等,深深地為之著迷。納什經常顯示出他與眾不同的自信和自負,充滿咄咄逼人的學術野心。1950年整個夏天納什都忙於應付緊張的考試,他的博弈論研究工作被迫中斷,他感到這是莫大的浪費。殊不知這種暫時的「放棄」,使原來模糊、雜亂和無緒的若干念頭,在潛意識的持續思考下,逐步形成一條清晰的脈絡,突然來了靈感!這一年的10月,他驟感才思潮湧,夢筆生花。其中一個最耀眼的亮點就是日後被稱之為「納什均衡」的非合作博弈均衡的概念。納什的主要學術貢獻體現在1950年和1951年的兩篇論文之中(包括一篇博士論文)。1950年他才把自己的研究成果寫成題為「非合作博弈」的長篇博士論文,1950年11月刊登在美國全國科學院每月公報上,立即引起轟動。說起來這全靠師兄戴維·蓋爾之功,就在遭到馮·諾依曼貶低幾天之後,他遇到蓋爾,告訴他自己已經將馮·諾依曼的「最小最大原理」(minimax solution)推到非合作博弈領域,找到了普遍化的方法和均衡點。蓋爾聽得很認真,他終於意識到納什的思路比馮·諾伊曼的合作博弈的理論更能反映現實的情況,而對其嚴密優美的數學證明極為讚歎。蓋爾建議他馬上整理出來發表,以免被別人捷足先登。納什這個初出茅廬的小子,根本不知道競爭的險惡,從未想過要這麼做。結果還是蓋爾充當了他的「經紀人」,代為起草致科學院的簡訊,系主任列夫謝茨則親自將文稿遞交給科學院。納什寫的文章不多,就那麼幾篇,但已經足夠了,因為都是精品中的精品。這一點也是值得我們深思的。國內提一個教授,要求在「核心的刊物」上發表多少篇文章。按照這個標準可能納什還不一定夠資格。1996年諾貝爾經濟學獎得主莫爾里斯當牛津大學艾奇沃思經濟學講座教授時也沒有發表過什麼文章,特殊的人才,必須有特殊的選拔辦法。納什在上大學時就開始從事純數學的博弈論研究,1948年進入普林斯頓大學後更是如魚得水。20歲出頭已成為聞名世界的數學家。特別是在經濟博弈論領域,他做出了劃時代的貢獻,是繼馮·諾依曼之後最偉大的博弈論大師之一。他提出的著名的納什均衡的概念在非合作博弈理論中起著核心的作用。後續的研究者對博弈論的貢獻,都是建立在這一概念之上的。由於納什均衡的提出和不斷完善為博弈論廣泛應用於經濟學、管理學、社會學、政治學、軍事科學等領域奠定了堅實的理論基礎。大原理的普遍應用大原理的普遍應用孫健從「納什均衡」的普遍意義中我們可以深刻領悟司空見慣的經濟、社會、政治、國防、管理和日常生活中的博弈現象。我們將例舉出許多類似於「囚徒的兩難處境」這樣的例子。如價格戰、軍奮競賽、污染等等。一般的博弈問題由三個要素所構成:即局中人(players)又稱當事人、參與者、策略等等的集合,策略(strategies)集合以及每一對局中人所做的選擇和贏得(payoffs)集合。其中所謂贏得是指如果一個特定的策略關係被選擇,每一局中人所得到的效用。所有的博弈問題都會遇到這三個要素。價格戰博弈:現在我們經常會遇到各種各樣的家電價格大戰,彩電大戰、冰箱大戰、空調大戰、微波爐大戰……這些大戰的受益者首先是消費者。每當看到一種家電產品的價格大戰,百姓都會「沒事兒偷著樂」。在這裡,我們可以解釋廠家價格大戰的結局也是一個「納什均衡」,而且價格戰的結果是誰都沒錢賺。因為博弈雙方的利潤正好是零。競爭的結果是穩定的,即是一個「納什均衡」。這個結果可能對消費者是有利的,但對廠商而言是災難性的。所以,價格戰對廠商而言意味著自殺。從這個案例中我們可以引伸出兩個問題,一是競爭削價的結果或「納什均衡」可能導致一個有效率的零利潤結局。二是如果不採取價格戰,作為一種敵對博弈論(vivalry game)其結果會如何呢?每一個企業,都會考慮採取正常價格策略,還是採取高價格策略形成壟斷價格,並儘力獲取壟斷利潤。如果壟斷可以形成,則博弈雙方的共同利潤最大。這種情況就是壟斷經營所做的,通常會抬高價格。另一個極端的情況是廠商用正常的價格,雙方都可以獲得利潤。從這一點,我們又引出一條基本準則:「把你自己的戰略建立在假定對手會按其最佳利益行動的基礎上」。事實上,完全競爭的均衡就是「納什均衡」或「非合作博弈均衡」。在這種狀態下,每一個廠商或消費者都是按照所有的別人已定的價格來進行決策。在這種均衡中,每一企業要使利潤最大化,消費者要使效用最大化,結果導致了零利潤,也就是說價格等於邊際成本。在完全競爭的情況下,非合作行為導致了社會所期望的經濟效率狀態。如果廠商採取合作行動並決定轉向壟斷價格,那麼社會的經濟效率就會遭到破壞。這就是為什麼WTO和各國政府要加強反壟斷的意義所在。污染博弈:假如市場經濟中存在著污染,但政府並沒有管制的環境,企業為了追求利潤的最大化,寧願以犧牲環境為代價,也絕不會主動增加環保設備投資。按照看不見的手的原理,所有企業都會從利己的目的出發,採取不顧環境的策略,從而進入「納什均衡」狀態。如果一個企業從利他的目的出發,投資治理污染,而其他企業仍然不顧環境污染,那麼這個企業的生產成本就會增加,價格就要提高,它的產品就沒有競爭力,甚至企業還要破產。這是一個「看不見的手的有效的完全競爭機制」失敗的例證。直到20世紀90年代中期,中國鄉鎮企業的盲目發展造成嚴重污染的情況就是如此。只有在政府加強污染管制時,企業才會採取低污染的策略組合。企業在這種情況下,獲得與高污染同樣的利潤,但環境將更好。貿易自由與壁壘:這個問題對於加入WTO不久的中國而言尤為重要。任何一個國家在國際貿易中都面臨著保持貿易自由與實行貿易保護主義的兩難選擇。貿易自由與壁壘問題,也是一個「納什均衡」,這個均衡是貿易雙方採取不合作博弈的策略,結果使雙方因貿易戰受到損害。X國試圖對Y國進行進口貿易限制,比如提高關稅,則Y國必然會進行反擊,也提高關稅,結果誰也沒有撈到好處。反之,如X和Y能達成合作性均衡,即從互惠互利的原則出發,雙方都減少關稅限制,結果大家都從貿易自由中獲得了最大利益,而且全球貿易的總收益也增加了。博弈論中的「囚徒困境」問題分 類:社科博弈論中的「囚徒困境」問題莉香葉子學習管理學或經濟學的人一定都了解一些博弈論方面的知識。在博弈論中有一個經典案例——囚徒困境,非常耐人回味。「囚徒困境」說的是兩個囚犯的故事。這兩個囚徒一起做壞事,結果被警察發現抓了起來,分別關在兩個獨立的不能互通信息的牢房裡進行審訊。在這種情形下,兩個囚犯都可以做出自己的選擇:或者供出他的同夥(即與警察合作,從而背叛他的同夥),或者保持沉默(也就是與他的同夥合作,而不是與警察合作)。這兩個囚犯都知道,如果他倆都能保持沉默的話,就都會被釋放,因為只要他們拒不承認,警方無法給他們定罪。但警方也明白這一點,所以他們就給了這兩個囚犯一點兒刺激:如果他們中的一個人背叛,即告發他的同夥,那麼他就可以被無罪釋放,同時還可以得到一筆獎金。而他的同夥就會被按照最重的罪來判決,並且為了加重懲罰,還要對他施以罰款,作為對告發者的獎賞。當然,如果這兩個囚犯互相背叛的話,兩個人都會被按照最重的罪來判決,誰也不會得到獎賞。那麼,這兩個囚犯該怎麼辦呢?是選擇互相合作還是互相背叛?從表面上看,他們應該互相合作,保持沉默,因為這樣他們倆都能得到最好的結果:自由。但他們不得不仔細考慮對方可能採取什麼選擇。A犯不是個傻子,他馬上意識到,他根本無法相信他的同夥不會向警方提供對他不利的證據,然後帶著一筆豐厚的獎賞出獄而去,讓他獨自坐牢。這種想法的誘惑力實在太大了。但他也意識到,他的同夥也不是傻子,也會這樣來設想他。所以A犯的結論是,唯一理性的選擇就是背叛同夥,把一切都告訴警方,因為如果他的同夥笨得只會保持沉默,那麼他就會是那個帶獎出獄的幸運者了。而如果他的同夥也根據這個邏輯向警方交代了,那麼,A犯反正也得服刑,起碼他不必在這之上再被罰款。所以其結果就是,這兩個囚犯按照不顧一切的邏輯得到了最糟糕的報應:坐牢。當然,在現實世界裡,信任與合作很少達到如此兩難的境地。談判、人際關係、強制性的合同和其他許多因素左右了當事人的決定。但囚徒的兩難境地確實抓住了不信任和需要相互防範背叛這種真實的一面。促使生物體和人類相互合作的策略促使生物體和人類相互合作的策略莉香葉子儘管合作與信任是如此難得統一,但是,無論在自然界還是在人類社會,「合作」都是一種隨處可見的現象。那麼,問題就出現了:到底是何種機制促使生物體或者人類進行相互合作呢?這個問題的答案大部分歸功於美國密西根大學一位叫做羅伯特·愛克斯羅德的人。愛克斯羅德是一個政治科學家,對合作的問題久有研究興趣。為了進行關於合作的研究,他組織了一場計算機競賽。這個競賽的思路非常簡單:任何想參加這個計算機競賽的人都扮演「囚徒困境」案例中一個囚犯的角色。他們把自己的策略編入計算機程序,然後他們的程序會被成雙成對地融入不同的組合。分好組以後,參與者就開始玩「囚徒困境」的遊戲。他們每個人都要在合作與背叛之間做出選擇。但這裡與「囚徒困境」案例中有個不同之處:他們不只玩一遍這個遊戲,而是一遍一遍地玩上200次。這就是博弈論專家所謂的「重複的囚徒困境」,它更逼真地反映了具有經常而長期性的人際關係。而且,這種重複的遊戲允許程序在做出合作或背叛的抉擇時參考對手程序前幾次的選擇。如果兩個程序只玩過一個回合,則背叛顯然就是唯一理性的選擇。但如果兩個程序已經交手過多次,則雙方就建立了各自的歷史檔案,用以記錄與對手的交往情況。同時,它們各自也通過多次的交手樹立了或好或差的聲譽。雖然如此,對方的程序下一步將會如何舉動卻仍然極難確定。實際上,這也是該競賽的組織者愛克斯羅德希望從這個競賽中了解的事情之一。一個程序總是不管對手作何種舉動都採取合作的態度嗎?或者,它能總是採取背叛行動嗎?它是否應該對對手的舉動回之以更為複雜的舉措?如果是,那會是怎麼樣的舉措呢?事實上,競賽的第一個回合交上來的14個程序中包含了各種複雜的策略。但使愛克斯羅德和其他人深為吃驚的是,競賽的桂冠屬於其中最簡單的策略:一報還一報(TIT FOR TAT)。這是多倫多大學心理學家阿納托·拉帕波特提交上來的策略。一報還一報的策略是這樣的:它總是以合作開局,但從此以後就採取以其人之道還治其人之身的策略。也就是說,一報還一報的策略實行了胡蘿蔔加大棒的原則。它永遠不先背叛對方,從這個意義上來說它是「善意的」。它會在下一輪中對對手的前一次合作給予回報(哪怕以前這個對手曾經背叛過它),從這個意義上來說它是「寬容的」。但它會採取背叛的行動來懲罰對手前一次的背叛,從這個意義上來說它又是「強硬的」。而且,它的策略極為簡單,對手程序一望便知其用意何在,從這個意義來說它又是「簡單明了的」。當然,因為只有為數不多程序參與了競賽,一報還一報策略的勝利也許只是一種僥倖。但是,在上交的14個程序中,有8個是「善意的」,它們永遠不會首先背叛。而且這些善意的程序都輕易就贏了6個非善意的程序。為了決出一個結果來,愛克斯羅德又舉行了第二輪競賽,特別邀請了更多的人,看看能否從一報還一報策略那兒將桂冠奪過來。這次有62個程序參加了競賽,結果是一報還一報又一次奪魁。競賽的結論是無可爭議的。好人,或更確切地說,具備以下特點的人,將總會是贏家。1.善意的;2.寬容的;3.強硬的;4.簡單明了的。一報還一報策略的勝利對人類和其他生物的合作行為的形成所具有的深刻含義是顯而易見的。愛克斯羅德在《合作進化》一書中指出,一報還一報策略能導致社會各個領域的合作,包括在最無指望的環境中的合作。他最喜歡舉的例子就是第一次世界大戰中自發產生的「自己活,也讓他人活」的原則。當時前線戰壕里的軍隊約束自己不開槍殺傷人,只要對方也這麼做。使這個原則能夠實行的原因是,雙方軍隊都已陷入困境數月,這給了他們相互適應的機會。一報還一報的相互作用使得自然界即使沒有智能也能產生合作關係。這樣的例子很多:真菌從地下的石頭中汲取養分,為海藻提供了食物,而海藻反過來又為真菌提供了光合作用;金蟻合歡樹為一種螞蟻提供了食物,而這種螞蟻反過來又保護了該樹;無花果樹的花是黃蜂的食物,而黃蜂反過來又為無花果樹傳授花粉,將樹種撒向四處。更廣泛地說,共同演化會使一報還一報的合作風格在這個充滿背信棄義劣行的世界上蔚然成風。假設少數採取一報還一報策略的個人在這個世界上通過突變而產生了。那麼,只要這些個體能互相遇見,足夠在今後的相逢中形成利害關係,他們就會開始形成小型的合作關係。一旦發生了這種情況,他們就能遠勝於他們周圍的那些背後藏刀的類型。這樣,參與合作的人數就會增多。很快,一報還一報式的合作就會最終佔上風。而一旦建立了這種機制,相互合作的個體就能生存下去。如果不太合作的類型想侵犯和利用他們的善意,一報還一報政策強硬的一面就會狠狠地懲罰他們,讓他們無法擴散影響。現在,對博弈論的研究是如此地廣泛,以致於有些人說最新的經濟學和管理科學都已經利用博弈論的理論和工具重寫過了。博弈論中有很多有趣而富於哲理的案例,善意、寬容、強硬、簡單明了的合作策略無論對個人還是對組織的行為方式都有很大的指導意義。
推薦閱讀:
推薦閱讀:
※單複數與陰陽性
※ARMS拳套大百科之屬性介紹
※rpg這種角色扮演遊戲載體分類有哪些?
※遊戲《我的世界怎麼去月球》中mod怎麼用?
※奧特曼格鬥版都有哪些奧特曼?
TAG:遊戲 |