標籤:

精通博弈論有什麼好處?

題主不是一個功利主義者,只是在翻書的時候書中有很多涉及博弈論上的內容難以理解,起了興趣,故有此一問

本題已加入知乎圓桌 ? 日常經濟學 · 博弈人生,更多「博弈論」話題討論歡迎關注


因為曾經的一些經歷,我認識了很多精通博弈論的學界精英。包括我自己的博導也是主攻博弈論研究的一個青年才俊。就我的觀察,從功利角度上說,精通博弈論基本上不會給個人帶來很現實的好處,大概最大的好處也就是理論研究相對比較容易發表學術文章。

非功利的角度說,博弈論提供了一套思維框架,讓你可以用來技術性地分析一些現實問題。最典型的例子是囚徒困境,是博弈論給我們揭示的一個驚人(反常識)的現象。Google、百度等搜索引擎巨頭的收入命門都是靠拍賣關鍵字廣告,而拍賣就是一個博弈論的重點研究對象,設計一個好的拍賣機制是直接影響這些巨頭的收入的,這也可算是一個博弈論的應用價值。

我自己在交易行業從業,這個領域裡做市場微結構(Market Microstructure)的人是需要大量用博弈論技術的,主要用來分析市場上為什麼會出現一些現象,也經常有一些深刻的揭示。比如說以前人們覺得做市商高賣低買賺差價(spread)就是純為賺錢,但是有學者用博弈論的框架分析,可以得出結論是這其實是因為市場上有專業投機者的存在,使得做市商必須設置差價(spread)來自我保護。你要是沿著這個框架的思路往下走,還可以分析 spread 的變化說明了什麼。總之是給你一種思維工具,讓你可以不必拍腦袋下結論。


精通博弈論的人,一般也不大願意讓別人知道自己精通博弈論。因為那樣帶來的麻煩,從長期看,可能會遠多於贏得這種名聲的好處。所以,題主應該看不到心中期望的答案啦。

整個二十四史,不都在反覆證明一個道理——聰明又不懂得保護(隱藏)自己的人,一般都活不久嗎?


讀過一點進階的博弈論教材,比如Rubinstein的和Myerson的,不能算精通,但對經典的結果還算熟悉。

我覺得最主要的用處還是做論文,幾乎所有現代的微觀理論分支都是基於博弈論的。不過這個用途比較顯然,先按下不表。

日常生活中,一般情況下沒有太大用處。並不是大家所想的精通「爾虞我詐」的那種形象。其實,博弈論這個名字比較討巧,要是有人望文生義,就會以為博弈論是「厚黑學」這類的錯誤觀點。事實上,博弈論乃是一系列的「多人決策模型」。

為什麼會就算博弈論學得好,日常生活中也不會得到些顯而易見的優勢呢?因為博弈論都假設所有的參與者都是理性的(actually,common knowledge of rationality,就是說我知道你是理性的,我還知道你知道我是理性的,and so on)。所謂納什均衡就是在這假定下,給定他人的策略,自己的策略是最優的。問題是如果有人不用納什均衡策略,我用納什均衡策略通常不是最優的。

最有名的例子:讓一群人同時從1到100選一個數字,誰最接近平均數的三分之二會得到獎勵。一個「精通」博弈論的人可能會選1(因為是這個博弈的唯一納什均衡策略)。但,如果別人「不精通」博弈論,可能會選個30,40,什麼的,結果選10的人(他也許根本不知道啥叫博弈論,也許他是個傻子,隨機選了個數字)得到了獎。作個可能不太恰當的推論:如果周圍都是一群聰明人,你需要博弈論,如果周圍是普通人,你更需要所謂的處事智慧。

但是。博弈論在生活中雖然沒有顯性的用處,卻在潛移默化中改變了我的思維方式,比如,換位思考。(換位思考的重要性是老生常談了,可有多少人真正實踐了呢?)。經過長時間的博弈論訓練我現在幾乎是本能地換位思考。博弈論里經常有這樣的情況,想讓自己的決策最優,先考慮給定自己的決策對方如何最優。久而久之在生活中也經常這樣推理。


@董可人 說的挺好。我來講個段子。
曾經我一個同學選導師的時候去找系裡的一位青年海歸,這位海歸老師的研究方向是理論博弈論(那些什麼拍賣、matching之類的都算應用,是真的理論博弈論),反正是很難的啦,基本上就是搞數學的。

本來以為那位老師會跟他聊聊什麼研究興趣之類,結果這位老師直接說:你別選我,做我這個方向找不著工作找不著老婆的!

我那個同學就嚇回來了。。。後來他選了另外一位大神當導師,剛發表了一篇JET。

以上。


現實中
99%的人都不是數學定義的理性人。
99%的混合策略均衡解的運算過程都無法概率量化。
99%的事件的局中人都不是有限個數的。
99%的事件都不是嚴格的完全信息博弈或不完全的。
99%的事件的策略集都不是有限個的。
99%的事件的策略回合都不是一人一次制的。

不要想學了博弈論就能在社會關係中遊刃有餘,或者至少會更輕鬆一點?
博弈論是數學,是應用數學
不是政治學,不是社會學,不是道德學,更不是心理學。


數學學的好一些。
博弈論考試能拿較高的分數。
寫論文容易發表。


實際上用到的地方不多~因為前提不成立……


認真的來回答一下這個問題。
精通博弈和精通博弈論還是有點差別的,博弈論其實是一個非常強大的理論,可以幫助我們理解很多東西,比如人類進化,道德進化等等。
但是生活中具體的博弈,學博弈論的用處並沒有那麼大,我們每一次博弈都會考慮對手的行為,但具體博弈的時候,我們最想知道的其實是對手的策略,但是很多時候我們不知道,比如競標。你用博弈論分析,不怎麼靠譜。生活中博弈困難在於獲取對手信息,再有信息情況下做出策略是很容易的,或者說我們天生就是一個不錯的博弈者。
博弈論本質是對博弈策略的分析,並不是教我們如何去博弈,如何獲取對手信息,而是從更宏大的層面理解人類行為。
---------------------------------------------------------------------------------------------------------------------------------
博弈論最核心的東西其實是為什麼明明有最優策略,但是現實中最優策略卻很難達成。


比如勤勞明明可以獲取更多成果,但是為什麼每個人都會有懶惰呢?答案是在一個合作社會裡,懶惰可以從群體中蹭到一些資源,所以有時候我們還會假裝很勤奮,比如去圖書館刷手機等等。
比如社會問題,環境污染,每個人都不去污染,那不是很好嘛?但是在沒有嚴格法制的情況下,均衡點是沒有人回去做這個事情,因為控制污染需要成本,別人不做,我做,那就吃大虧了,企業是會破產的,所以很多時候你去責怪企業主沒有道理。
------------------------------------------------------------------------------------------------------------------------------
首先給大家提一下,囚徒困境,懂得人可以跳過。
囚徒困境
警察抓了兩個小偷,如果都不肯招,於是聰明的警察,給他們挖了這麼一個坑,具體如下圖。
兩人都不招,都判三年,兩人都招,都判五年,一個人招,一個人不招,那麼招的判一年,不招的判十年。

囚徒困境示意圖
按照囚徒困境術語,不招的行為算作「合作」(和你的獄友合作,不是和警方合作),而招認的行為算作「背叛」。雙方都合作最好,雙方都背叛則兩敗俱傷。按照這個故事,合作根本不可能出現啊。
現實中類似囚徒困境的場景常常出現。但是,更多的結局似乎是合作,而不是背叛。為什麼?
可能的原因是,困境不止這一次。
重複囚徒博弈
如果嫌疑人X和Y是陌生人,那麼兩人的下場都是三年。
但是他們也許是兩肋插刀的好哥們,或者有血親,或者屬於同一個組織,背叛之後,組織將進行追殺!總而言之,他們可能需要重複博弈,或者受到更強大的制約。這樣合作就比較容易出現了。
以上就是囚徒困境的主要模型了,以下是博弈論推到出社會進化模型。

一位名叫羅伯特·阿克斯羅德的政治學家在上世紀80年代初做了一個名垂青史的實驗。他在計算機里擺了一場錦標賽,有很多名虛擬的參賽選手,捉對進行重複囚徒博弈。按照博弈的結果記分,你背叛他合作,則你得5分他得0分,雙方都合作各得3分,雙方都背叛各得1分。
然後,他向全世界徵集策略,每一個得到的策略變成一個參賽選手。提交的策略共有14個,來自經濟學、社會學、政治學和數學等等領域,再加上一個「完全隨機」的對照策略,共15「人」進行比賽。這裡面有些策略極其複雜極其精妙,比如有一個策略用馬爾科夫過程為對方的行為建立模型,然後用貝葉斯推斷最好的選擇。
但是,最後得分最高的竟然是所有提交策略里最簡單的一個——「一報還一報」(TFT, tit for tat)。這個策略一共只有兩條規則:(1)第一步先合作,(2)從第二步開始,對方上一輪出的是什麼,我就出什麼。提交這個策略的是維也納的安納托·拉伯波特,他寫這個策略只用了4行BASIC代碼。
阿克斯羅德發表了錦標賽的分析結果,並邀請大家吸取經驗教訓提交新一輪策略——這次他獲得了62個策略,不但有上面提到的領域,還包括了演化生物學、物理學和計算科學等新學科。只有一個人厚顏無恥地原樣提交了上次的衛冕冠軍,那就是拉伯波特本人。你猜對了。他又一次獲得了勝利。
TFT這個「報仇者」成功的秘訣並不複雜。阿克斯羅德說,它有三個要素:它第一輪總是合作,先表示善意;它會懲罰背叛者;如果對方改過自新,它也不會咬住不放。
現實中總會因為各種原因結下仇怨,那樣冤冤相報何時了。但是當你背叛後會出現負罪感,可以容忍一次報復。

有突變和自然選擇的重複囚徒博弈
(1)自然發現了寬恕

其一,當對手選擇合作你選擇背叛,你可能出現負罪感,可以容忍一次報復。
其二,每一個策略的「環境」都是武斷決定的。一個策略能否成功,和它身邊別的策略如何有很大的關係。假如群體里全都是永遠背叛者,那麼報仇者完全占不到任何便宜。而阿克斯羅德錦標賽里的參賽選手都是人為提交的,這可不能說是有代表性的樣本。
因此,在阿克斯羅德實驗的基礎上,馬丁·諾瓦克制定了一輪新的錦標賽:引入了自然選擇。
他不再邀請人類專家設計策略,而是規定了一個大小合適的策略空間,允許策略在裡面進行「繁殖」和「突變」。這裡的策略可以想像為人類,人類的繁衍和突變,當然這裡也有缺陷,就是策略並不直接關係到人類的生死和繁殖,生死和繁殖優勢和別的很多都有關係,但我們先不考慮這個了。
總之,在策略空間里,每一輪得分高的策略後代多,得分低的沒有後代甚至自己都消失掉,但每個後代的策略也都和自己有十分微小的差異。此外,每次行為都有一定的「誤會」概率——本來我應該合作,但實際出手的卻是背叛。
一開始,故事的發展和上面一樣。起始的一團糟很快被誰都不信任、每一局都背叛的「背叛者」橫掃,但其中很快又出現了一小團一報還一報的「報仇者」。然後報仇者有很大的概率靠自己內部合作,反過來推倒背叛者。
但是現在故事不會到此結束了。因為有誤會。
報仇者很擅長對付壞人。但是如果對方不是壞人,而是犯了錯誤的好人呢?報仇者太記仇,不會放過這一點,如果對方也是報仇者,那相互合作立刻會變成相互背叛,就要陷入冤冤相報何時了的永遠循環之中了。
這時,突變出現了「寬恕者」。它的策略學名叫「慷慨的一報還一報」(GTFT)。它的特點是,即使對方出了背叛,下一輪也有一定的概率選擇合作,這樣就可以挽救陷入無窮背叛的可能。在論文里,諾瓦克驕傲地宣布:「自然選擇發現了寬恕」
顯然,寬恕存在的前提是周圍有足夠多的好人(報仇者或者其他寬恕者)。如果周圍都是壞蛋(背叛者),你的寬恕只會被別人利用。
可好人太多了,又會有另一個問題。
(2)歷史的循環
但如果出現濫好人呢,不管怎麼樣我都永遠合作。這比報仇者和寬恕者對誤會的忍受能力更強,寬恕者還有一定概率不原諒,濫好人則是永遠原諒,立刻拉回合作的「正軌」,所以它的得分更高。這整個群體會逐漸變成都是濫好人。
但是,壞人從未遠去。群體里永遠會因為突變而出現新的壞人。而一群只知道合作的濫好人,面對壞蛋那就是白花花的肥肉啊。很快無比成功的壞人會佔據群體的大部分。
於是,一切重新開始。
這個壞人-&>報仇者-&>寬恕者-&>濫好人-&>回到壞人的循環是極其普遍的,而且它的普遍不止存在於博弈論模型里——好人合作打敗了壞人,多年以後好人放鬆了警惕、壞人於是東山再起,這個敘事模型在各種故事傳說里都十分普遍。至於這能否作為現實人類歷史上戰爭和平循環的抽象表述,那就見仁見智了。
(3)打破輪迴?
那麼,我們註定只能面對這個無盡循環了嗎?並非如此。諾瓦克的初代模型里,每個策略只能考慮上一輪對方出了什麼。如果它不但考慮了對方,還考慮了自己呢?如果它關注的不是對方的策略,而是策略帶來的結果呢?
在改進之後的模型里,意外出現了一個新的穩定策略:「輸則改之,贏則加勉」(WSLS, win-stay, lose-shift)。
這策略很簡單。如果我上一輪佔了便宜(雙方都合作,或者他合作了我背叛),那這一輪我繼續上輪策略。如果我上一輪吃了虧(雙方都背叛,或者我合作了他背叛),那這一輪我就換一種策略。換言之,這是一種「反思」型。
當兩個反思者相遇,它們大部分時間都合作。萬一遭遇了噪音,那麼下一輪雙方都背叛;再下一輪雙方又合作了。糾錯延遲只有1回合。這一點比寬恕者更強,只比濫好人弱一點點。
但反思者不怕濫好人。和濫好人打交道,開始雙方都合作,但是早晚要出現誤會導致反思者背叛,接下來……反思者發現濫好人不懂得報復。於是以後每一輪都是反思者背叛、濫好人合作,沒有分辨力的後者遭到慘無人道的剝削而退出遊戲。這樣一個反思者組成的社會不會隨著時間推移而「放鬆警惕」變成濫好人,當然也就不會遭受壞蛋的後續必然入侵。
人類的進化
諾瓦克的本行可以算作是演化生物學家。他們關心的,是在一個自然選擇的框架下,合作何以可能。
自然選擇會將策略植入它們的大腦中。好的策略自然能流傳,哪怕動物本身不理解這個策略為何好、甚至不知道自己正在執行一個策略。自然選擇只在乎結果。
而人和人的心智,也是自然選擇的產物。進化的策略也適用於人類,當然人類繁殖並不僅僅是策略的進化,還是有一點差別的。策略的對錯並不生死攸關。
現實世界裡任何策略都可能是存在的,而且教育的影響,目前的教育是鼓勵大家做一個濫好人的,這個我在另一片道德的進化里分析。所以我們也並不是完全,輸則改之,贏著加冕。

最後總結一下,博弈論分析,「輸則改之,贏著加冕」是人類的一種本能的優勢策略,同樣「一報還一報」也是非常有效的優勢策略,不想動腦筋的時候可以選擇這兩個。
當然以上的分析也存在一定的漏洞,就是忽略的信息傳導,也就是我們沒有博弈過,但是我們卻都知道了對方的一些信息,這個在道德博弈中尤為明顯。

當然用博弈論來分析道德系統,道德的進化,給你們一個鏈接。
在不違反法律的前提下,我們可以選擇做一個壞人嗎? - 一竹的回答


博弈論是」宇宙社會學「這一學科最根本的思想來源。

可以說,整個黑暗森林法則就是一個簡單的納什均衡在宇宙範圍內的運用。
猜疑鏈就是囚徒困境的複雜版本,黑暗森林打擊就是博弈的最終均衡結果。

我不相信,葉文潔和羅輯想出黑暗森林法則之前,沒有參考過微觀經濟學中的博弈理論。葉文潔是物理專業的,但是在大學任教,完全能基礎最前沿的經濟學理論。羅輯是天文學專業,但是精通社會學;一個理科專業的人才研究社會學,如果要發揮他的專長,運用數學上的優勢,最好的選擇必然是研究偏向於經濟學方向的部分,這就離不開對微觀經濟學的掌握。羅輯參考過博弈論的分析方法,是毫無疑問的。

可以說,沒有納什的理論基礎,羅輯或許拯救不了人類文明。與其說,羅輯是黑暗森林法則之父,不如說是納什。

再想想納什的經歷吧:

納什經常能看到所謂不存在的事物,一直懷疑有人暗殺他。剛開始他從美國逃到了歐洲,後來發現要暗殺他的並不是克格勃、不是美國中情局。他還曾經寫信給毛澤東,要求來中國避難。那麼,要暗殺他的究竟是什麼人?

如果說他看到」不存在的東西「是因為他真的有精神分裂症,而精神分裂症,是所謂精神上的」癌症「,根本治不好。是什麼原因,讓1980年以後的他,突然」變好了「?再也看不到那些東西了?

唯一的解釋就是:真的有人想暗殺他。真的有一種神秘力量,在為他製造幻象。

而就在前幾天,納什去世了,死於車禍,據說是因為沒戴安全帶。

為什麼會這麼蹊蹺?

看看新聞的描述:

美國有線電視新聞網援引警方的話說,計程車司機當時試圖超車,車輛卻失控,撞上防護欄。納什夫婦被彈出車外,兩人當場遇難。

車輛突然失控,是什麼原因?好好一輛車怎麼就會突然失控了呢?這裡面太多蹊蹺。

想想智子製造的神跡,想想智子對羅輯的幾次暗殺,細思恐極。


難道不是古巴導彈危機?


可以在自己不合理消費的時候找出各種各樣稀奇古怪的借口,來把手裡的物品買下來。


專業方面的不懂,說點生活上的
確實很多博弈論的定義與結論都是基於理性人角度,我們現實中應用感覺不太靠譜
不過我們還是可以進行一部分的預測,只是你自己要知道社會人與理性人的區別在哪,並且適當進行調整,比如情感因素很容易使單一納什均衡變成混合策略納什均衡
博弈論也可以進行事後分析,這樣理論與實際的區別就可以當作這個人的偏好,並應用到接下來的策略中
有用肯定是有用,只不過看你怎麼用


中國叫做悶聲發大財

越高調越有能力死的越早

把自己大牌都藏起來最好

打贏了的時候雙王4個2插底最好

把24史看遍不都是這樣

你看薛之謙不就知道了

其實他也有牌+更大的資本媒體的勢力

其實不是不能洗

一開始哭著道歉,承認錯誤等等

之前陳赫不是洗過來了嗎(當然其有前妻幫忙)

薛之謙也有自己老婆,完全可以設計成第三者插足

勾引啊,自己上當啊

接著來成龍大哥那句,是男人都會犯錯誤

低調2,3年

出來又是條好漢

可他以為李沒什麼牌了

結果開始準備攻擊

自己得意一笑

自己炸彈連打2個,留張A+一個炸彈手上

結果李淡定一笑

4個2,接著1個A,接著一個K

最後雙王炸

留一單張

薛自己給李火上給點汽油啊

最後只能宣布退出娛樂圈

悶聲發大財

記住給自己留炸彈


回答不僅針對於博弈論。
想起上學期上decision theory的時候,老師在提到偏好的傳遞性的時候說的一段話,大意是:

「我們假設偏好滿足這些性質,不一定代表事實上人們本身真的是這麼想的,但是至少說當人們看到這些性質時候,會覺得很合理,覺得應該按照這樣去做決策。」

在我的理解中,一個學習並且相信經濟學的人,在做決策的時候會自然而然的認為「我應該這樣決策才合理」,也就是在決策的時候腦子裡隱含著某個目標函數(objective function),會有underlying的理論支撐自己做的決策,而不是純憑感覺去決定(當然涉及不確定性的時候會依照主觀的或者「感覺的」概率)。
所以有時候真不好說經濟學是提供一個理論來解釋現象,還是提供了一個理論讓人們follow這個理論去決策。

在博弈論方面,我覺得現實生活中相對來說用
到的頻率比決策理論要少得多,因為strategic interaction在日常生活中真的發生的很少。我能想到的常用的是對理性的common knowledge,伴隨的刪除被佔優策略等,在某種意義上其實算是degenerate成為了一個決策問題。

另一個可能被運用在生活中比較有意思的例子是關於information disclosure的。比如說當別人說他是前10的時候,基本上知道他大概是第八第九或第十,說自己是前5的時候基本上就是4、5名,說自己前三一般都是第三。

總的來說博弈論在大型機構方面或許用的比較多,這也是為啥美國很多大公司都有招理論經濟學家。但是在個人生活層面,除了學習經濟學帶來的理性思考的益處以外,博弈論本身沒有太大的幫助。


1)囚徒困境:(人質困境)

C鮮就是完美的人質困境模型。人質困境是囚徒困境的分支。講的是少數幾個劫匪控制了一大群人的方法。

#實現囚徒困境的方法是禁止一切交流。發明者是商鞅。製造絕對的封閉。人之間的封閉,內外的封閉。

#破解囚徒困境的方法就是囚徒之間增加交流。

交流可以導致群體行為。一致性群體行為是幹掉劫匪的唯一方法。

劫匪在群體中安插姦細,製造互不信任是防止群體行為的重要方法。/5貓是一隻重要力量,他不僅可以污染信息,製造群體內部矛盾。還是一隻監視力量。

----------------------------------------

破解某國的囚徒困境。

1,人員流動X掉戶口制度

2,互聯網加強交流,溝通。煩牆。

交流手段的進化:論壇-微博-微信

論壇第一次實現了陌生人的交流

微博的進化是人人可以發布新聞,相機進入手機增加了新聞的真實性,大微可以發布信息,具有廣泛的傳播性。

微信的重大改進是建立圈子,目的是屏蔽了5貓的信息污染和破壞。

2)單次博弈與複合博弈

單次博弈最佳解是作弊。

多次博弈最佳解是合作。


中國古代開始就是以使用詭計而聞名,各種詭計厚黑大行其道,詭計就是欺騙。都是單次博弈的主要特徵。。。中國人不講長遠利益,這是農耕文明中人的重要特徵。樸素的利己主義者是個人特徵。農耕文明中群體間是領地劃分,群體內部是嚴格的等級制度。

中國小孩學習都是為了以後劃分等級,成為人上人,對學到知識本身根本不感興趣。表現急功近利只看分數。。農耕文明是最近接動物文明。動物內部等級最高的先吃,等級低的後吃。

樸素的利己主義者的思維特徵:自己是思維的中心。凡事只有利害。

知乎上有個著名的問題,好像是科學知識很多都是沒有用的,為什麼還有人學?

樸素的利己主義者的眼光就和螞蟻一樣。。凡事只和自己的利害有關,當然不理解為什麼有人會有人學這樣的東西。這就是文明的衝突。

工業文明重要特徵是契約精神,在商業合作中,商業信譽是重要營商手段,目的是使得陌生人間可以迅速達成交易。信譽是基礎。免去了嘗試的過程,從而簡化了交易過程。促進了社會發展。

工業文明的人喜歡講信譽責任。比如負責任大國。

重複博弈講究合作,欺騙會破壞合作基礎,摧毀信譽,招致報復。合作可以獲得更大的利益。工業文明更講長遠利益。。。。

3)獵鹿博弈:分久必合。合久必分。

打獵高手一個星期能達到一隻鹿。可以吃1個月。

打獵低手一天星期能達到一隻雞。可以吃1天。

打獵高手+打獵低手一起打鹿1星期打2隻,兩人分。高手可以吃1.5個月,敵手可以吃半個月。兩人都有利。。但是如果高手拿走的太多,低於低手以前的收入,群體破裂。。國家也是這樣。如果一個國家中利益全部被高階層拿走,。。。。。。。

4)槍手博弈:(這個大家都知道)

應用:製造共同的敵人(知道的人不多)。.....

甲乙兩方博弈,甲眼看乙對自己越來越恨,害怕哪天乙用刀捅了自己。就對乙說座山雕殺了你媽。我們去找座山雕算賬吧。乙就去找座山雕啦。甲看著乙的背影。。。笨蛋~~。


謝邀福利是納什均衡。


利益相關:讀過最淺的博弈論,正在寫德州撲克AI。

覺得我的例子更有說服力一些,畢竟是博弈論的應用。

博弈論稱game theory,在game中還是非常的有用。

例:德州撲克中經常遇到這樣的情況,你擁有一手聽牌,已經湊齊了一手同花的四張,如果最後發出一張同花色的牌,你就贏了,否則就輸了,底池100,你需要跟注30,你要如何抉擇?

這是一個簡單的數學問題,說它簡單是因為它比德州撲克里的心理戰要易於量化和計算,你只要學過博弈論就可以算了。

你手上2張牌,公面4張牌,其中4張是同花色(在這裡舉例紅桃)。一副牌52張,共13張紅桃。你沒有看到的是46張,在這46張里,有9張紅桃。發出紅桃的概率是9/46=19.57%。

然後計算是否下注,如果下注獲勝,你的籌碼(+100)乘上幾率9/46,如果失敗,你的籌碼(-30)乘上幾率37/46。

期望值為-210/46=-4.57,意味著長期來看,每次跟注會損失4.57個籌碼。

那麼如果是20個籌碼呢?那麼是需要下注的。理由同上。

再簡單計算,當跟注額度小於24.32,亦或者說,24.32%*pot(底池)時,跟注就是長期有利的。

再簡單計算,如果你想讓一手同花聽牌難以跟注,你所下的籌碼x要滿足x/(x+pot)&>24.32%,x&>30.95%*pot。

於是我們在無數比賽中看到的1/3底池下注有了最合理的博弈論解釋。

------
今天又算了一下你的對手任意牌時翻盤圈中對的概率,1/3。

翻盤發出ABC,你至少擁有一張A或B或C的概率是多少?一共4張A,還剩3張,BC同理,你需要的牌為9/49=18.37%。

你有兩張手牌,所以至少一張的概率1-(1-9/49)^2=1/3。

另外,手持一對,翻盤中set概率11.53%


博弈論更多的是一種思維方法,對於個人來說生活上的指導意義不是很大,對於社會性團體來說有一定作用。
比如博弈論入門的納什均衡,也就是囚徒困境,實際上在生活中的指導意義不是很大,只能作為參考,因為實際生活與虛擬環境的差別太大,變數更多。
比如有可能兩名囚徒從小玩到大,相互十分信任,這時你會認為他們傾向於選擇說謊,因為這時加入了從小玩到大的變數。
但後來經過按鍵調查發現囚徒甲搶了乙的女朋友,乙最近才發現這個事實,這時你會認為他們都會招供,因為加入了反目成仇的變數。
最後通過背景調查發現,兩名囚徒實際屬於瞅你咋的砍死你信不信幫會,如果招供的話會被組織懲罰,這時你又會認為他們不會招供了,因為加入了犯罪集團背景的變數(中國沒有黑社會)。
實際上,我還可以虛構一些甲是警方卧底,而後來發現組織要求甲放長線釣大魚等新的變數,但我認為到這裡應該足夠說明問題了:生活不是理想環境,學術上的方法對於個人實際生活來說局限性較大,不具有實際可操作性。
換言之,對於個體來說,應用博弈論指導生活不是不可以,但受制於個人信息渠道的匱乏,丟失重要變數,最終導致理論結果與實際結果南轅北轍,同時你還無謂的付出了大量精力來進行博弈推論。
而對於社會性團體來說,特別是跨國公司和國家等超級團體來講,他們能夠有財力和人力來彌補以上缺陷,從而應用博弈論指導戰略選擇。
另外,即使是國家層面,最終做決定的也是人,博弈論的推定結果僅僅是一個參考而已,畢竟世界不是一個虛擬的理想環境。
最後補充一下,學習博弈論也不一定就要通過他獲利,實際上樂趣也很多,你可以作用博弈論的思辨方法來看待各種問題,多一個角度能夠使你對世界的理解更加立體和客觀。


贊同 @一竹 在其答案開頭髮表的觀點:精通博弈論絕對不等同於精通博弈。從題主提問的角度來看,我不打算跟題主深論博弈論是否有用、精通之後能否帶來某種好處;反之,我打算問一問題主:從題主發問的出發點,知道精通博弈論的好處,與你真的想要了解博弈論,有多大的關聯?

的確,很多時候,「好處」是我們對新事物產生了解興趣的動力。舉例,對Computer Science無甚興趣的人(比如我),考慮到幾年後的專業深造或者職業發展需要一定深度的電腦基礎,也開始了對CS的學習了解。

可是這種了解乃至未來的精通,其好處是明確而直效的:個人(職業)發展可以絕對受益。

我們再來看:博弈論。

題主很明確表示,自己非功利:看到部分涉及博弈論的內容 =&> 難以理解 =&> 想要了解。
但是在想要了解前提下的提問卻是:精通博弈論有什麼好處?

我答案是:如果出於實用的發展需求,沒什麼太大的好處。
因為題主你的提問,可以說在了解(一時半會地看幾本書實在談不上精通)博弈論這個話題上,坐實了「決定行為適當與否在於其結果的實用程度」。

精通博弈論有好處嗎?有,當然有,甚至不需要精通,了解也足夠。
但是——從中獲得的自身成就感和視野的通透感,實在是最大的「好處」。不再僅僅局限於抉擇,而是更加深刻清楚地明白抉擇的原因,根據,和目的。

因為是對你興趣的正向回饋,而不是什麼實質上的好處,所以效益範疇的獲益,微乎其微。樓上幾位的回答都涉及到了實質生活中博弈論的運用,已經說明了這一點。

______________________________________________________________________________________________________________________________________
我一定程度上贊同 @程傑 在「興趣是如何產生的?如何培養?」中的回答:

「當一個人從第一次接觸一件事到入門初步掌握這件事,這個過程的體驗好壞決定了對此事的興趣多少。也就是說,不管你學習任何一項技能,選擇任何一種專業,從事任何一個工作,如果你在剛接觸的時候可以比較順利達到入門,體驗到些許成就感,那麼你就會對它感興趣,甚至越來越有興趣,也越學越好。反之,初學體驗不佳將直接導致興趣喪失。」

如果題主不是真的對博弈論本身很感興趣,同時對非「嚴肅探討博奕論」的書籍所涉及的博弈部分已經感到很難理解,那我的建議是——

先別管那些什麼「好處」不「好處」的。不管你是不是出於功利目的,不妨先感覺入門無壓力並且開始感到津津有味了,再來「計算」自己可以從中獲益多少,以及自己在不在乎那所謂的「好處」。


如果在在感情的事情上,尤其愛情,且用情真切,則再精通此術,也有可能被爆出翔。其他事物,若精通此論則多益罷!

所以,再理智碰到真性情,也有可能被虐殺!


推薦閱讀:

納什均衡在國際政治博弈上有哪些應用?

TAG:博弈論 |