如何應對「一美元拍賣陷阱」？在博弈的不同階段應該怎麼做才能把損失降到最低？

01-08

1美元拍賣案例，由著名博弈論專家，耶魯大學教授馬丁. 舒比克所設計：一名拍賣人拿出1張1美元鈔票，請大家給這張鈔票開價，每次叫價的增幅以5美分為單位，出價最高者得到這張1美元，但出價最高和次高者都要向拍賣人支付出價數目的費用。在1美元拍賣的多次實驗中，研究者發現：最初人們的出價也許只是覺得有趣，但是隨著價格的攀升，人們逐漸意識到掉入了一個陷阱，但已經難以全身而退；這時候就試圖通過繼續加價來迫使對手退出，但每個人都這麼想，結果價格不斷攀升；最後，當價格非常高時，競爭者變得焦慮不安，並且深深後悔，覺得自己很荒唐，但是已經難以自拔。這種心理正是人類在很多現實狀態下心理的一個折射。例如，有的人只是覺得想嘗試一點兒趣味而參加賭博，結果不幸輸了一些錢，於是又繼續加註希望在下一局贏回來，但結果是越賭越輸，越輸就越想從賭博中撈回，進入惡性循環狀態，直至最後輸得精光。

原論文可以參見：http://www.math.toronto.edu/mpugh/Teaching/Sci199_03/dollar_auction_1.pdf

結合論文內容來說一下我的觀點：

1. 根據論文，要解決這個「陷阱」，其方式包括：

（1）第一個競拍，並直接競拍1美元，此時對理性人來說是納什均衡，所有人收益為0；

（2）事先協議，結成聯盟，只競拍5美分；

（3）製造可信威脅，第一個競拍者在競拍5美分後承諾（或者說威脅）：如果有另一個人競拍且競拍價小於1美元，則我立即競拍1美元；如果競拍價大於1美元，則我在其基礎上加價5美分競拍。如果這個威脅通過某種方式導致可信（比如，競拍者將此策略輸入機器，讓機器自動根據其它報價進行競價，且機器一旦開啟不能停止），那麼實際上和（1）相似，利用可信威脅修改收益導致納什均衡。

2. 實際上，我覺得與其說這是因為人的「貪婪」，不如說是因為人的「要面子」。比如說，如果不是一個序貫進行的拍賣（當然，原文事先限定了這是一個extensive game拓展式博弈），而是一個sealed bid auction，由於該博弈和second-price sealed-bid auction在分配上是一樣的，直接用Revenue Equivalence Principle計算最優的increasing bid，根據對於估值分布的不同估計，很容易計算出相應的最優報價，這時候人並沒有脫離「貪婪」，還是理性的，其結果也很正常。

比如，假定所有人的估值都是1（其實我不太確定這是否符合Myerson Auction的要求……），根據REP計算最優報價是1/2。再比如，假定belief是所有人的估值為[1-δ,1+δ]上的均勻分布（ex-ante），而我的估值（的實現）是1（ex-post），這時候可以放心用REP計算得我最優的bid是(n-δ)/n^2，讓δ取極限0，則bid是1/n。

進一步說，其實存在一種真實的拍賣叫all-pay auction，即出價最高的人獲得物品，所有人均付出報價。當然，這種拍賣不是真的在拍賣場上出現的，舉個例子，現在有N家公司都在做某種新技術研究，每家公司都付出了其研發成本，但是有一家公司付出的成本最多，因此它最先完成並申請專利，所有的收入都歸它了，這就是一個all-pay auction。反過來，如果這種機制真的出現在拍賣場上，會有人去競拍嗎？其實all-pay auction不就是把本題中的2個人擴大到了所有人的情形嗎？所以我覺得主要還是歸因於「序貫」。

3. 由於這個問題很有可能會扯向人是否理性的討論，我想說，在一定程度上，這個博弈說明人是短視的。然而，正如論文所說的，可能有一些我們沒有考慮的因素，使得它其實仍然是理性的（或者說，博弈論並不是inadequate的）。我舉個例子，為什麼遊戲會開始呢？因為大家覺得很好玩，即參與遊戲本身就已經帶來收益了，這個收益如果超過1美元的話，即使有人出價超過1美元而沒有得到錢，對他來說也並沒有損失（我覺得最後遊戲停止往往是因為隨著遊戲的進行，心理賬戶上把愉悅的收益和遊戲實際的收益區分開了）。再比如，有的人看重面子，所以特別想贏下來，就容易成為最後爭奪第一的玩家之一。關於其它的因素，我舉在Berkeley旁聽高微時Ben提的一個故事，他在MBA課程的最後一節課，都會給MBA學生玩了一個遊戲，拿一個袋子，告訴他們裡面裝有0~20美元，讓他們競拍，最後結果一般都會超過10美元，達到15甚至20美元，但是每次他拿的其實都是空袋子，於是他表示，你們這幫人都沒學過finite game嗎？都最後一節課了出現的一定是NE，我拿的肯定是0美元啊！我當時就想，這些MBA是不是短視或是不理性？也不一定，因為也許他們的目的就是要在教授心中留下印象，或是藉此機會能夠和教授交談等等，當然也包括信任，或是參與遊戲的樂趣。所以說博弈論inadequate不妥，我覺得更應當說是簡單的序貫博弈無法描述這其中複雜的心理要素的緣故。

謝邀 @Zampeli Diana 。前面的回答已經說得很清楚了，尤其是 @Richard Xu，觀點鮮明，表達清晰流暢。

Richard Xu 的回答已經總結了論文的觀點，在這裡再重複一遍（重要的話再說一遍）

根據論文，要解決這個「陷阱」，其方式包括：
（1）第一個競拍，並直接競拍1美元，此時對理性人來說是納什均衡，所有人收益為0；

（2）事先協議，結成聯盟，只競拍5美分；
（3）製造可信威脅，第一個競拍者在競拍5美分後承諾（或者說威脅）：如果有另一個人競拍且競拍價小於1美元，則我立即競拍1美元；如果競拍價大於1美元，則我在其基礎上加價5美分競拍。如果這個威脅通過某種方式導致可信（比如，競拍者將此策略輸入機器，讓機器自動根據其它報價進行競價，且機器一旦開啟不能停止），那麼實際上和（1）相似，利用可信威脅修改收益導致納什均衡。

題注的疑問是在博弈的不同階段應該怎麼做才能把損失降到最低，那麼現在就把前面答案中的一些觀點結合我自己的理解總結一下：

1.博弈開始階段

（1）第一個競拍，並直接競拍1美元，此時對理性人來說是納什均衡，所有人收益為0。

因為這是一個序貫博弈，當第一個競拍人直接競拍1美元，第二個人沒有理由繼續競價，若有第二競價，那麼第二人的收益必小於0，所以最終第一人競拍得到1美元，付出1美元，收益為0；第二競拍人收益也為0。

（2）開始就形成聯盟，競拍5美分，得到1美元後，將95美分平分。

（3）所有參與人都不參與競拍。這是@蘆葦和@吳宇翔答案中提到的。

從結果上看，所有人都不參與競拍，該策略的支付與(1)相同，所有人的收益也均為0。但是要求參與人選擇這一策略就等於開啟了上帝模式，以第三者的身份強行干預參與人的選擇。因為（不參與，不參與）這一策略組合是不穩定的，只要其中有一人選擇了背叛，選擇參與，那麼他就能以5美分的代價獲得1美元。這有點像囚徒困境，雖然（不參與，不參與）對整體來說是最好的結果，但是在這一策略組合中，每個參與人都有偏離這一策略的動力（背叛就能獲益）。於是，最後兩個人都會選擇參與到競拍中。況且這是一個序貫博弈，當第二競拍人知道第一競拍人不參與時他必定會參與競拍，所以最後還是大家都參與競拍。因此，這條去掉。

2.競拍進行階段

（1）製造可信威脅。這一點@Richard Xu的答案已經闡明。

（2）當競拍價加到100美分時，另一競拍人立即競拍200美分。為了更直觀理解，假設A為第一個競拍，B為第二個競拍，則上述過程為：A 95→B 100→A 200

此時若B繼續加價，其虧損必將大於100。如B繼續加價到205，A無論是否繼續，則B虧損都大於或等於105，比現在就結束競拍虧損100大。所以B沒理由繼續競拍，競拍結束，所有人收益為﹣100。

推廣：設當參與人意識到已陷入陷阱時已競價到x美分（x&>100），則當且僅當下一次標價100+x才能儘早結束競拍把損失降到最低。此時對方沒有動力繼續競價，雙方收益均為﹣x美分。

另外，關於遊戲為什麼會開始，Richard Xu的回答說大家都覺得很好玩，參與遊戲帶來心情愉快，所以就參與競拍，並提到了心理賬戶的概念。

關於心理賬戶的概念和應用可以參見：

五塊錢丟了不心痛，為什麼用五塊錢買個甜筒掉了就很心痛呢？ - 捏捏誠的回答

下面我們假設每個參與人都有兩個賬戶：「心情」賬戶和「現金」賬戶

首先，參與人覺得這遊戲很有趣很好玩，因此參加遊戲就能給參與人帶來好心情。我們賦予參與人參與遊戲前的心情狀態為0，參加遊戲的話，參與人的「心情」賬戶收益+100。對輸贏不確定，「現金」賬戶為0（這就好像當你無聊時，牌友邀請你打牌，你答應了，參與打牌解脫了你的無聊獲得了好心情，同時未知能否贏得牌局，所以賦予+100的心情收益，「現金」賬戶為0）。此時兩個賬戶總餘額為100.

接下來，我們假設當競價到30的時候，參與人發現自己陷入了一個陷阱，同時預計這樣下去會輸，而且會越輸越多。此時參與人開始出現煩躁心情，想脫離這個遊戲但又退不出來，我們假設此時參與人的心情為﹣100，「心情」賬戶餘額為﹣100；同時由於已標價30，在不考慮能否得到1美元的情況下，「現金」賬戶餘額為﹣30。（好比你答應牌友打牌，雖然一開始被牌友邀請很高興，但是打牌總是輸，而且越輸越多，此時心情必然比當初參與打牌前的心情差，所以賦予﹣100的心情收益，當預計某一局要輸時，也知道將要支付現金是很可能的事情，所以「現金」賬戶為﹣30）此時兩賬戶總餘額為﹣100+﹙﹣30﹚＝﹣130

我們再來假設存在「mood—cost」曲線（「心情—花費金錢」曲線）符合邊際效用遞減規律。那麼剛開始時的心情曲線是下圖中的U1曲線的點(0，100），邊際效用為k1；當競價到30時，參與人發現陷入陷阱，心情為﹣100，U1曲線往右下移動到U2，參與人處在點（30，﹣100）,邊際效用為k2，此時k2&>k1，代表參與人多花1單位的錢就能得到更多的心情增值。

◆例如參與人再花現金10，預期能帶來40的心情增值，那麼此時預期「心情」賬戶餘額就是﹣60，「現金」賬戶就是﹣40，兩賬戶總餘額為﹣100，比之前的﹣130要好。

因此，在（30，﹣100）的點上，只要參與人多花一點錢就可以使得心情和總結果變得更好（相對於﹣100的心情來說）。這樣看來，參與人就有動力繼續競拍，因為都想獲得更好的結果。但是越到後面，參與人的心情曲線就越往右下移，使得邊際效用越來越大，參與人也就越重複「◆」的思考，也就越想花錢或贏得競拍以使得總結果更好。（當然，這必須在參與人的購買力範圍內）

因此，參與人就是這樣「被帶進」局，並且越陷越深。

不知這樣解釋是否清晰、大家是否明白。

Richard Xu回答中提到，簡單的序貫博弈可能無法描述這其中複雜的心理要素。我也認同這一點。

上述的自"mood-cost"曲線以下的內容純粹個人的想法，沒有經過實驗驗證，不知是否正確，希望能拋磚引玉，大家權衡著看吧。

弱弱回答一下這個問題，以下為不成熟的看法，如有錯誤求輕噴

假設競猜者足夠理性聰明且不懷好意（自己要賺錢，假如不能賺錢要讓自己損失最低——理性，且別人的損失不能低於自己的損失——不懷好意）

1 小於100美分以下，有盈利空間

2 大於100美分以上，開始虧本。

（廢話）！

————————————————————————

且慢，出現100美分之後，可能出現以下情況，以105美分為例。

倒數第二輪競價，某人出價95，另外一人出價100，（最高者暗自得意，小樣，老子不賺錢了，看你怎麼辦），結果第二名咬咬牙，出價105！這時，第二名出價為100，第一出價為105，於是第二虧100（因為他出價為100），第一虧5.第二名想，NMB，你才虧5，我要虧100.老子傻啊？於是105之後，第二的出價不會穩步上升，而是直接加價到205！PS：第一和第二都虧105，否則低於205的報價都會讓這個過程惡性循環.因為低於205的報價，都勢必導致出價最高的損失小於出價第二,導致惡性循環，這是最終的止損措施。

此題最關鍵的止損，我認為只有三個瞬間。其他兩個瞬間，其他答主已給了清晰的過程。

1 一開始就不參與該遊戲

2 開始遊戲後，因為100以下都有錢賺，最終的價格會到達95.

3 有95的價格，就有100的報價，超過100之後，出現虧損情況，這時如果對方不懷好意，但是足夠理性，出價105之後，果斷出價205！

——————————————————————————————

根據以上，有如下推論：假如所有的人足夠聰明，只會在遊戲開始搶5的報價，報價出來之後不會有第二個人競爭。因為，如果這個時候出現了一個SB出10，SB賺90，第二名虧5，根據不懷好意的原則，第二名根本不會說什麼廢話，不會加價到15，而是對加價到105（除非出現第二個SB報價15，第二名得以全身而退），自己和SB的虧損一致，才能防止SB繼續報價。

所以，假如所有的人足夠聰明，只會出現5的價格，而不會有其他價格。這個遊戲不是遊戲者和遊戲者之間的博弈，而是主辦方和遊戲者的博弈，而博弈的內容就是遊戲者的貪心和愚蠢。

但這不是答主所說的，日常賭博中越輸越賭的原因。

既然都叫陷阱了不參加當然最好，如果既然參加了就只能止損了。

1.在每一個階段都有脫離的可能性，一旦成為第三高就收手，毫無損失。

2.如果有一個愣頭青和你對肛，無第三者把你拉出這個陷阱，你才會真正陷入進去，止損什麼的在這種情況下才真正有討論意義。我們就假定只有兩個人，人多了可能就涉及更具體的東西了，現在沒時間討論

3.假設雙方都是受貪婪驅使（實驗能夠展開的前提），在達到100美分之前不可能停下來，也就是說兩個理性人必然會進入純虧階段（》100美分）

4.但最後的勝者可以比次高者少輸95美分，好像可以無限加價下去，而且此後的每一次加價都是為了彌補之前犯的傻，但只會讓自己更傻

一種思路：共贏，兩個人一開始就是命運共同體，最好的結果是出價5美分就停，然後拿著1塊去買棒棒糖每人舔一口。就算大家都已經虧了，越早達成共識虧得越少

另一種思路：由於這個陷阱是漸進式的，一步步討論永無止境，那我們不妨設立一個「出發點」，比如說最容易引起質變的100美分。達到100美分時，對面繼續出價105，進入純虧階段。這時候貪婪的推動力消失，玩下去純粹為了止損。但如果現在收手，虧100。繼續出價的動力在於自己有可能虧少於100美分。只要有這個可能性，這有賭下去的合理性。那麼這個合理性什麼時候會丟失呢？那就是200美分的時候，200美分拍下來，也是虧100美分。在此之後，沒有可能虧少於100美分。以100美分為出發點，此時繼續往下賭沒有合理性。不過你也有可能就這麼虧了200，這多虧的部分就是為了止損而產生的風險。

一旦連賭的合理性也喪失了，就沒有任何繼續的理由了。

總結一下，這個模型就是：（1貪婪心很重，5美分也是賺！（2賭性很大，有一丁點概率我就要賭！為了虧得少我也要賭！

在這個模型下，應終止於200美分。（這裡有一個思維陷阱，希望看官們能理解。我所說的「出發點」相當於坐標系，這樣的問題套入坐標系中就很容易討論了）

再換一種思路，那就只能無限賭下去了

直接不參加這種詐騙活動就可以了，你打算從詐騙犯手裡獲利就已經掉到陷阱里了

假設所有參與者都很理性的前提下，開口就叫95美分。此時後來者的收益期望已經降至0以下（最好為0），從而使所有其他參與者出局。

其實這個拍賣必須有且只有一個「托兒」。