我們身邊的概率和博弈問題_講壇_求是理論網
中世紀歐洲盛行擲骰子賭博,其中提出許多很有趣的概率問題。當時法國的帕斯卡、費爾馬和旅居巴黎的荷蘭數學家惠更斯都對此類問題感興趣,他們用組合數學研究了許多與擲骰子有關的概率計算問題。自20世紀30年代柯爾莫哥洛夫提出概率公理化以來,概率論迅速發展成為數學領域裡一個相對較新的和充滿活力的學科,並且在工程、國防、生物、經濟和金融等領域得到了廣泛的應用,而且與人們的生活有著密切的聯繫。拉普拉斯有一句名言:「生活中最重要的問題,絕大部分其實只是概率問題」。
在遵守一定「遊戲規則」的前提下,具有競爭或對抗性的行為稱為「博弈」,比如打牌、下棋、企業經營或國際間的政治和軍事談判等。博弈的思想歷史淵源悠久。《史記》中就記載了戰國時期「田忌賽馬」的故事,這是運用博弈思想以弱勝強的經典例子。《孫子兵法》中含有豐富而深刻的博弈論思想。1944年美國數學家馮·諾伊曼和摩根斯特恩的著作《博弈論與經濟行為》創立了博弈論這門學科。上世紀80年代以後,博弈論已經成為整個社會科學特別是經濟學的核心。著名經濟學家薩繆爾森認為:要想成為現代社會中有文化的人,必須對博弈論有大致的了解。
下面我試圖通過若干例子來向大家展示概率論和博弈論是如何成為我們「日常生活指南」的。
一."生日悖論"
n 個人中至少有兩人生日相同的概率P(n)是多少?這是有名的"生日問題"。答案是:對於n≤365,P(n)=1-Q(n),其中Q(n)為n個人生日都不相同的概率:
下面是一張對照表:
令人難以置信的是:隨機選取的23人中至少兩人生日相同的概率居然超過50%,50人中至少兩人生日相同的概率居然達到97%!這和人們的直覺是抵觸的。因此這一結果被稱為生日悖論,儘管它在數學上是正確無誤的。理解"生日悖論"的關鍵在於任意兩個人的搭配方式可以很多,例如23個人可以產生23×22/2=253種不同的搭配。
二.如何理解社會和大自然中出現的奇蹟?
對單個彩民和單次抽獎來說,中樂透頭獎的概率是2250萬分之一,但到2008年之前,在"紐約樂透"史上發生過3次一人中兩次頭獎的事件。例如,2007年8月30日美國紐約的安傑洛夫婦喜中"紐約樂透"頭獎,獲得500萬美元獎金。他們1996年與另外3人共分了1000萬美元頭獎。這真是堪稱一個奇蹟。
在河北省著名旅遊景點野三坡的螞蟻嶺左側,斷崖邊緣有一塊直徑10米、高4米的"風動石",此石著地面積不足覆蓋面積的1/20,尤其基部接觸處只有兩個支點。這也算是一個奇蹟。
從概率論觀點看,上述兩個奇蹟的發生並不奇怪,因為即使是極小概率事件,如果重複很多次,會有很大概率發生。"紐約樂透"每周三及周六晚間各開獎一次,每年開獎104次,15年間經歷約1500次開獎。假定以前中過"紐約樂透"頭獎的人還經常買"紐約樂透"彩票,而且他們下的總注數每次超過3000注(注意:中過大獎的人一次可能下很多注),那麼在15年間他們之中有人再中頭獎的概率超過1/5,這已經不是很小的概率了。大自然中的奇蹟是地殼在億萬年的變遷中偶然發生的,但這種奇蹟在歷史的長河中最終出現則是一種必然現象。
三.在分組對比中佔優,總體上一定佔優嗎?
答案是:不一定!下面是一個例子。假定有兩種葯(A和B),要通過分組臨床試驗對比其療效。以下是試驗結果的統計表:
從甲乙兩組試驗結果看,藥物A的療效都優於藥物B,但總體來看,藥物B的療效反而優於藥物A。早在20世紀初,當人們為探究兩種因數是否具有某種相關性而進行分組研究時就發現了這種現象:在分組比較中都佔優勢的一方,在總評中反而是劣勢。直到1951年英國統計學家辛普森在他發表的論文中才正式對這一現象給予理論解釋。後人就把這一現象稱為"辛普森悖論"。
四.如何評估疾病診斷的確診率?
假想有一種通過檢驗胃液來診斷胃癌的方法,胃癌患者檢驗結果為陽性的概率為99.9%,非胃癌患者檢驗結果為陽性("假陽性")的概率為0.1%。假定某地區胃癌患病率為0.01%。問題是:
(1)檢驗結果為陽性者確實患胃癌的概率(即確診率)是多大?
(2)如果"假陽性"的概率降為0.01%、0.001%和0,確診率分別上升為多少?
(3)用重複檢驗方法能提高確診率嗎?
早在18世紀中葉,英國學者貝葉斯(Bayes)就提出"由結果推測原因"的概率公式(貝葉斯公式)。我們用"+"表示陽性,用H、F分別表示胃癌患者和非胃癌患者,則由貝葉斯公式,確診率為:P(H|+)=P(+|H)P(H)/P(+)。
問題(1)的答案是:確診率為1/11;問題(2)的答案是:如果"假陽性"的概率降為0.01%、0.001%和0,確診率分別上升為50%、90.9%和100%;問題(3)的答案是:有一定的提高,但大幅度提高的可能性很小。原因是"假陽性"主要是檢驗技術本身問題造成的,重複檢驗的結果相關性很大,不能按獨立事件對待。
五.在猜獎遊戲中改猜是否增大中獎概率?
這一問題出自美國的電視遊戲節目"Let"smakea deal "。問題的名字來自該節目的主持人蒙提·霍爾。上世紀90年代曾在美國引起廣泛和熱烈的討論。假定在台上有三扇關閉的門,其中一扇門後面有一輛汽車,另外兩扇門後面各有一隻山羊。主持人是知道哪扇門後面有汽車的。當競猜者選定了一扇門但尚未開啟它的時候,節目主持人去開啟剩下兩扇門中的一扇,露出的是山羊。主持人會問參賽者要不要改猜另一扇未開啟的門。問題是:改猜另一扇未開啟的門是否比不改猜贏得汽車的概率要大?答案是:改猜能增大贏得汽車的概率,從原來的1/3增大為2/3。也許有人對此答案提出質疑,認為改猜和不改猜贏得汽車的概率都是1/2。為消除這一質疑,不妨考慮有10扇門的情形,其中一扇門後面有一輛汽車,另外9扇門後面各有一隻山羊。當競猜者猜了一扇門但尚未開啟時,主持人去開啟剩下9扇門中的8扇,露出的全是山羊。顯然:原先猜的那扇門後面有一輛汽車的概率只是1/10,這時改猜另一扇未開啟的門贏得汽車的概率是9/10。
六.如何設計對敏感性問題的社會調查?
設想要對研究生論文抄襲現象進行社會調查。如果直接就此問題進行問卷調查,就是說要你直說你是否抄襲,即使這樣的調查是無記名的,也會使被調查者感到尷尬。設計如下方案可使被調查者願意做出真實的回答:在一個箱子里放進1個紅球和1個白球。被調查者在摸到球後記住顏色並立刻將球放回,然後根據球的顏色是紅和白分別回答如下問題:你的生日是否在7月1日以前?你做論文時是否有過抄襲行為?回答時只要在一張預備好的白紙上打√或打×,分別表示是或否。假定被調查者有150人,統計出共有60個√。問題是:有抄襲行為的比率大概是多少?已知:P(紅)=0.5,P(√|紅)=0.5,P(√)=0.4,求條件概率P(√|白)=?用貝葉斯公式算出的答案是30%。
七.為什麼企業間的"價格聯盟"往往是短命的?
在博弈論里有一個著名的"囚徒困境"問題:兩個共同犯案囚徒不坦白也不揭發對方可能得到最輕的處罰(判刑1年);如果一方坦白並揭發對方,另一方不坦白,坦白方判刑2年,不坦白方判刑10年;如果兩方都坦白和揭發對方,各判刑5年。但一方總會懷疑另一方為了減刑而出賣自己,如果自己不坦白就會受到加重處罰,所以選擇坦白和揭發對方是兩個囚徒共同的最佳策略。因為在對方坦白前提下自己不坦白將被加重處罰。這是非合作博弈的"納什均衡":任何一方單方面改變策略只能對自己造成不利。"納什均衡"理論對人類社會有著廣泛而深刻的意義。它已經深入到社會的政治、軍事、文化、經濟領域各個層面,成為人們思維的一部分。
從博弈論的角度分析,在一個競爭的市場中,如果商品嚴重地供大於求,則要陷入"囚徒困境"。因為對任何供應商來說,最佳策略都是降價促銷,以期獲得更大的營業額,從而價格戰不可避免。要從"囚徒困境"解脫,供應商被迫形成"價格聯盟"。但每個商家都想自己偷著降價給自己帶來好處。因此,價格聯盟只能是短命的,因為它不是一個"納什均衡"。
八.為什麼現實生活中"搭便車"現象不可避免?
這首先要從博弈論中著名的"智豬博弈"故事說起。這個故事有多種版本,其大意是說:在一個長長的豬圈裡,有一頭大豬和一頭小豬,豬圈一端有個踏板,需要多次費力踩踏板,豬圈另一端才會落下一些食物到食槽。如果小豬去踩踏板,大豬會在小豬跑到食槽之前就吃完落下的9成食物,而小豬只能得到1成食物;如果是大豬踩踏板,則大豬能在小豬吃完3成落下的食物之前就跑到食槽,搶到其餘的7成食物。假定踩踏板要費掉相當於2成食物轉化的體能,兩隻豬各自會採取什麼策略呢?對小豬而言,等待大豬去踩踏板是最佳策略,這就是所謂的"搭便車"策略。對大豬而言,由於知道小豬的等待是最佳策略,它不得不去踩踏板,這是它的唯一選擇,否則它也要和小豬一樣挨餓。在現實社會生活中,懶人和偷奸取巧的人從生活經驗的積累中無意識地就學會了"搭便車"策略。
九.為什麼在多人非合作博弈中弱者有時反倒有利?
下面是著名的"三個快槍手決鬥"模型:甲、乙、丙同時開槍進行決鬥,倖存者進入下一輪決鬥。如果他們的命中率分別是0.9,0.8和0.5,則他們的最優策略是甲、乙互射,丙對準甲射擊。結果是相對較弱的乙和丙結成了"暫時聯盟"。三國時期的孫權和劉備就是結成了暫時聯盟對付曹操的。通過概率計算,甲、乙、丙經過兩輪決鬥後倖存下來的概率分別是4.5%,5%,90.5%。當然,這一模型是理想化的數學模型,但它給了我們很好的啟示:弱者在強者競爭的夾縫中倖存下來的例子在商界是層出不窮的。
十.存在完美的民主選舉制度嗎?
早在18世紀,法國思想家孔多賽就提出了著名的"投票悖論"(Voti ng paradox):假設甲乙丙三人面對a、b、c三個備選方案有如下的偏好次序:甲:a>b>c,乙:b>c>a,丙:c>a>b。
如果對備選方案進行兩兩對決,投票結果是:a優於b,b優於c,c優於a,得出自相矛盾的結果!所以按照少數服從多數的投票規則,不一定能得出合乎大多數人意願的所謂"社會偏好次序"。
受到孔多賽的"投票悖論"的啟發,1951年,美國著名數理經濟學家阿羅用數學公理化方法對通行的投票選舉方式能否保證產生出合乎大多數人意願的領導者進行了研究。結果,他得出了一個驚人的結論(即阿羅"不可能"定理):當至少有3名候選人和2位選民時,不存在滿足阿羅公理的選舉規則。由於他的"不可能"定理和在一般均衡理論方面的突出貢獻獲得了1972年諾貝爾經濟學獎。按照著名經濟學家薩繆爾森的評價,阿羅"不可能"定理可以和數理邏輯學中的哥德爾"不完備性定理"相媲美。
相關鏈接
概率論(probability theory)是研究隨機現象數量規律的數學分支。隨機現象是相對於決定性現象而言的。在一定條件下必然發生某一結果的現象稱為決定性現象。隨機現象則是指在基本條件不變的情況下,一系列試驗或觀察會得到不同結果的現象。每一次試驗或觀察前,不能肯定會出現哪種結果,呈現出偶然性。隨機現象的實現和對它的觀察稱為隨機試驗。隨機試驗的每一可能結果稱為一個基本事件,一個或一組基本事件統稱隨機事件,或簡稱事件。事件的概率則是衡量該事件發生的可能性的量度。雖然在一次隨機試驗中某個事件的發生是帶有偶然性的,但那些可在相同條件下大量重複的隨機試驗卻往往呈現出明顯的數量規律。
概率論的起源與賭博問題有關。16世紀,義大利的學者吉羅拉莫·卡爾達諾開始研究擲骰子等賭博中的一些簡單問題。17世紀中葉,當時的法國宮廷貴族裡盛行著擲骰子遊戲,遊戲規則是玩家連續擲4次骰子,如果其中沒有6點出現,玩家贏,如果出現一次6點,則莊家(相當於現在的賭場)贏。按照這一遊戲規則,從長期來看,莊家扮演贏家的角色,而玩家大部分時間是輸家,因為莊家總是要靠此為生的,因此當時人們也就接受了這種現象。
後來為了使遊戲更刺激,遊戲規則發生了些許變化,玩家這回用2個骰子連續擲24次,不同時出現2個6點,玩家贏,否則莊家贏。當時人們普遍認為,2次出現6點的概率是一次出現6點的概率的1/6,因此6倍於前一種規則的次數,也既是24次贏或輸的概率與以前是相等的。然而事實卻剛好相反,從長期來看,這回莊家處於輸家的狀態,於是他們去請教當時的數學家帕斯卡,求助其對這種現象作出解釋,這個問題的解決直接推動了概率論的產生。
隨著18、19世紀科學的發展,人們注意到在某些生物、物理和社會現象與機會遊戲之間有某種相似性,從而由機會遊戲起源的概率論被應用到這些領域中;同時這也大大推動了概率論本身的發展。
概率與統計的一些概念和簡單的方法,早期主要用於賭博和人口統計模型。隨著人類的社會實踐,人們需要了解各種不確定現象中隱含的必然規律性,並用數學方法研究各種結果出現的可能性大小,從而產生了概率論,並使之逐步發展成一門嚴謹的學科。現在,概率與統計的方法日益滲透到各個領域,並廣泛應用於自然科學、經濟學、醫學、金融保險甚至人文科學中。
博弈論(GameTheory)亦名"對策論"、"賽局理論",屬應用數學的一個分支,目前在生物學、經濟學、國際關係、計算機科學、政治學、軍事戰略和其他很多學科都有廣泛的應用。博弈論主要研究公式化了的激勵結構間的相互作用,是研究具有鬥爭或競爭性質現象的數學理論和方法,也是運籌學的一個重要學科。博弈論考慮遊戲中的個體的預測行為和實際行為,並研究它們的優化策略。生物學家使用博弈理論來理解和預測進化論的某些結果。
古語有云,世事如棋。生活中每個人如同棋手,其每一個行為如同在一張看不見的棋盤上布一個子,精明慎重的棋手們相互揣摩、相互牽制,人人爭贏,下出諸多精彩紛呈、變化多端的棋局。博弈論是研究棋手們"出棋"招數中理性化、邏輯化的部分,並將其系統化為一門科學。換句話說,就是研究個體如何在錯綜複雜的相互影響中得出最合理的策略。事實上,博弈論正是衍生於古老的遊戲或曰博弈如象棋、撲克等。數學家們將具體的問題抽象化,通過建立自完備的邏輯框架、體系研究其規律及變化。這可不是件容易的事情,以最簡單的二人對弈為例,稍想一下便知此中大有玄妙:若假設雙方都精確地記得自己和對手的每一步棋且都是最"理性"的棋手,甲出子的時候,為了贏棋,得仔細考慮乙的想法,而乙出子時也得考慮甲的想法,所以甲還得想到乙在想他的想法,乙當然也知道甲想到了他在想甲的想法……
博弈論思想古已有之,我國古代的《孫子兵法》就不僅是一部軍事著作,而且算是最早的一部博弈論專著。博弈論最初主要研究象棋、橋牌、賭博中的勝負問題,人們對博弈局勢的把握只停留在經驗上,沒有向理論化發展。
1928年,馮·諾依曼證明了博弈論的基本原理,從而宣告了博弈論的正式誕生。1944年,馮·諾依曼和摩根斯坦共著的劃時代巨著《博弈論與經濟行為》將二人博弈推廣到n人博弈結構並將博弈論系統的應用於經濟領域,從而奠定了這一學科的基礎和理論體系。
1950~1951年,約翰·福布斯·納什(JohnForbes Nash Jr)利用不動點定理證明了均衡點的存在,為博弈論的一般化奠定了堅實的基礎。納什的開創性論文《n人博弈的均衡點》(1950),《非合作博弈》(1951)等等,給出了納什均衡的概念和均衡存在定理。此外,塞爾頓、哈桑尼的研究也對博弈論發展起到推動作用。今天博弈論已發展成一門較完善的學科。博弈論(GameTheory)和決策論(Decision Theory )、運籌學(Operations Research)等一起構成現代企業經濟、軍事戰略等系統管理學的理論基礎。
推薦閱讀:
※你想嫁誰娶誰都不是問題,前提是你HOLD住
※金字塔原理:思考、寫作和解決問題的邏輯
※徐賁:「我們」是誰?——論文化批評中的共同體身份認同問題
※糖尿病胰島素治療的11個問題
※鄭永年:當代民主出現了什麼問題?