日課:改變世界的博弈論和我們有什麼關係?

今日敘事

2015年5月23日,美國數學家約翰·納什(John Nash Jr.)和妻子遭遇車禍,不幸逝世。

1950年,納什在論文中提出一個重要概念(之後被稱為「納什均衡」),成為博弈論中的一項重要突破。如今,「納什均衡」早已廣泛運用在經濟學、計算機科學、演化生物學、人工智慧、會計學、政策和軍事理論等方面。納什也因此於1994年與其他兩位博弈論學家共同獲得諾貝爾經濟學獎。

今天,我們就來談談為世界帶來深遠影響的博弈論。


改變世界的博弈論和我們有什麼關係?

文 / 張磊(蒲公英教育智庫研究員)

人類,是追求利益的動物。當人與人出現交集的時候,難免會產生利益衝突。當雙方都想達成某種目的的時候,肯定會受到彼此的影響,這種情境就是「博弈」。這個時候,「博弈心理學」或者說「博弈論」就能派上用場了。

相信很多人都聽過「囚徒困境」一詞——兩個犯罪嫌疑人隔離審訊,他們都做出利於自身的事,最後卻導致對雙方都不利的結果——它形容的就是博弈論的一種經典情況。

博弈論是一門怎樣的學問?

那麼,博弈論到底是什麼?

學界的定義是,「在某種特定的條件下,相互影響的多個主體之間所產生的戰略性的相互關係」,「在這種相互依存的情況下,為了合理地確定行為模式和分配方法而進行思考的數學理論」。

相信即使反覆看了幾遍,很多讀者仍然會一頭霧水。所以我們簡化了一下,博弈論就是「推測對手的行動,在此基礎上合理地確定對自己最有利的戰略」。這時,對手和我們一樣,也想「獲得最大的利益」,因此, 「博弈論」往往能在雙方的相互影響中,幫我們找到一種最合適的選擇。

我們所生活的社會,就是人與人之間、企業與企業之間,在遵守一定規則的前提下,為了達成各自的目的而進行的競爭(有時也有合作)。可以說,人生處處都有博弈。

博弈論的核心:納什均衡

博弈論思想可以追溯到18世紀,但主要的理論發展開始於20世紀20年代。1944年馮·諾依曼和奧斯卡·摩根斯坦出版的《博弈論和經濟行為》一書,被公認是博弈論誕生的標誌。1951年,約翰·納什提出「納什均衡」成為博弈論的重大突破,這才讓博弈論引起關注,並開始運用到經濟學、社會行為學等多個領域。

「納什均衡」可以理解為約翰·納什給博弈提出的一種解法,甚至可看作博弈論的核心。

用一句話形容「納什均衡」,就是:指博弈的局中人都對自己選擇的策略感到滿意,對於得到的結果也不會後悔的一種選擇。

下面,我們用博弈論中最經典的狀況之一——囚徒困境來詳細地解釋一下。

事情是這樣:

參與某個案件的兩位犯罪嫌疑人A、B一起被警方抓獲了。由於警方還沒有掌握兩人犯罪的確鑿證據,如果A和B始終保持沉默,將因為證據不足無法起訴。

於是警方就想了個辦法:將A和B分開關押,並對他們說相同的一番話:

1. 如果你坦白交代,而你同伴保持沉默的話,可以算你戴罪立功,立即釋放,你同伴就判有期徒刑4年;

2. 如果你們兩人互相揭發對方,證據齊全,各判有期徒刑2年;

3. 如果你們兩人始終保持沉默,我們沒有證據,只能扣留你們2天。

嫌疑人A、B利益關係更直觀的圖表如下:

囚徒困境 嫌疑人B
沉默 坦白
嫌疑人A 沉默 2天(A)2天(B) 4年(A)0天(B)
坦白 0天(A)4年(B) 2年(A)2年(B)

我們嘗試用博弈論來分析一下。

首先,尋找A的最佳策略。當B選擇「沉默」,A選擇「坦白」的結果最佳(沉默關2天;坦白關0天);如果B選擇「坦白」的話,A同樣只有選擇「坦白」的結果最佳(沉默關4年;坦白關2年)。因此,對於A來說,無論如何,選擇「坦白」的結果都好過「沉默」。

同樣的,B的最佳策略也會是「坦白」。

因此,對於A、B兩人都是「坦白」的結果好於「沉默」。兩人的最佳策略,就是「坦白」對「坦白」(上表中右下角淡藍色表格),雙方都將被判2年有期徒刑。而這種策略組合,就是上述案例中的「納什均衡」。

但是,有讀者可能覺得有問題,上面表格中最佳策略明明是「A、B兩人都保持沉默」(上表中淺灰色表格)才對啊?

的確,如果A、B兩人是被關進同一間審訊室,雙方有可能找機會用眼神交流,達成「都別招供」的默契,從而都選擇「沉默」。但是,無論上例還是真實情況中,警察都會採取單獨審訊以防串供。這樣一來,在嫌疑人無從知曉同夥會「沉默」還是「坦白」的情況下,往往只能根據「坦白對那傢伙更有利,他一定會供出我的,我還是坦白好了」的推測。最終,雙方都會選擇對自己而言最佳的策略,即「坦白」從寬。

只不過,這樣的「最佳」策略反而會導致雙方得不到真正「最佳」的結果。看到這裡,有沒有想起刑偵劇里常出現的那句「你的同夥剛剛已經招供,我勸你也趕緊坦白吧」台詞?

生活中的博弈論

類似「囚徒困境」的博弈類型,在現實生活中經常能夠見到。

比如,企業之間的價格競爭。價格戰中,企業「不降價」相當於上例中的「沉默」,「降價」相當於「坦白」。在博弈過程中,互相競爭的企業就容易陷入競相降價的囚徒困境中。

再如,國家與國家之間的軍備競賽也可以視作囚徒困境,「削減軍備」相當於「沉默」,「擴充軍備」相當於「坦白」。結果,競爭國之間就陷入了無窮無盡的軍備擴充競賽。

除了囚徒困境,博弈論中還有很多有趣的討論。前不久《速度與激情8》上映,票房火爆,這類電影里經常出現的「雙方迎頭飆車互不相讓,最後一刻總有人先認慫錯開」場景,就是博弈論中所討論的「膽小鬼博弈」。

贏得這種博弈的方法也很有趣,本來雙方有「加速」和「轉向」兩個選項,但如果其中一方主動放棄「轉向」的選項,並且讓對方看到——比如讓其他人把自己綁住,無法動彈。為了避免最大的損失,對方的唯一理性的選擇,就只剩下「轉向了」。

博弈論本身其實是一門及其複雜的學問,需要用數學建立各種不同的模型,還要結合社會學、經濟學、心理學等各方面的知識。剛剛我們只是用了一些比較簡單、有趣的案例找到這門學問一個小的切入點作了介紹。如果還有不太清晰的地方,不如再看看下面這則科普小短片:《科普:博弈論是什麼?》

博弈論是從20世紀50年度以來改變了科學界、經濟學界的重大理論。不敢妄談用短短2000多字篇幅就將它完整、清晰地呈現在讀者面前。但如果今天的日課能引起你對它額外的興趣,那會是小新君莫大的榮幸。

最後,下面這些情境中,博弈論也能派上用場,你知道嗎?感興趣的話,不妨留言談談你的想法。

1. 有些老師為什麼會自願義務加班?

2. 讓領導認同自己思路、方法的技巧

3. 讓對方難以回絕的交涉方法

4. 家校糾紛逐漸惡化升級的原因,以及應對策略

5. 主動要求承擔更多工作好處多,還是等領導安排工作更佔便宜?

推薦閱讀:

改變世界的手稿
改變世界的伊斯蘭教第二次東擴
誰願意與我一起改變世界
愛因斯坦相對論是如何改變世界的
別天真了,大數據不是為了改變世界,而是為了坑你的

TAG:博弈論 | 世界 | 改變 | 改變世界 | 關係 | 我們 |