如果用進步次數評定一個人的成績,如何獲取第一名?

上中學的時候經常有一種獎,叫進步獎。現在我把這個問題抽象一下。如果挑出10個智商很高且成績差不多的學生到一個班裡,跟他們說明,我們現在進行10次考試,進步次數越多越好。進步定義為本次的考試名次比上次的靠前。採取什麼策略才可以讓自己獲取第一名呢?


並不是所有遊戲都有必勝策略。

我來證明這一點:如果這個遊戲有必勝策略,由於這個遊戲沒有輪流下的步驟,每次決策都是同時進行的,因此這個必勝策略如果存在,那麼根據對稱性,對於每個人都有效。因此每個人都有必勝策略,而這是不可能的。因此這個遊戲沒有必勝策略。

完。


沒有必勝策略。

但是,10個聰明且理性的博弈者一起玩大概一直是Nash Equilibrium:

第一次:大家一起考零分,一起拿第一。——納什均衡

第二次:大家一起考零分,一起拿第一。——納什均衡

....

第九次:大家一起考零分,一起拿第一。——納什均衡

第十次:大家隨便怎麼考。因為上次是所有人都是第一名,這一次肯定沒法進步了。——納什均衡

博弈結果:所有人都進步零次,所有人並列第一。

簡單的解釋一下為什麼第一次考零分是Best Response。

因為第一次考試沒有參考名次,所有人都不會取得進步次數+1的收益。假如player i在第一次沒有得到最後一名,再下一次考試中取得進步次數+1的可能性就會降低。(因為大家都一樣聰明,認真考試的話名次就是隨機排列的。)因為下一次考試名次是隨機的,也就是說,無論第一次考什麼名次都不會影響第三次到第十次的博弈受益。

既然第一次大家都是第一名了,第二次考試註定沒有受益,大家也會一起考零分,又一起拿第一。直到最後一局,大家一起隨便考,反正都不可能取得進步。

上廁所間隙想的,有漏洞的話見諒...(歡迎指出)


如果作為整體來看,我覺得不存在納什均衡。

因為其實可以這樣,我第一次隨便考一個分數,譬如說考一分。如果其他人都考零分,那麼在下次考試,其他人就有了動力來超過我獲得獎勵,而這一次超過就可以讓我得到名次提升的機會。

所以第一次考100分,第二次考0分,第三次再考100分,第四次0分,,,,以此類推,也是最優策略。

當我選擇考100分的時候,別人的最佳選擇是考0分。但是在下次博弈的時候,我就可以選擇考0分來獲得最低的排名,最終在第三次考試得到進步。

如此一來,我可以獲得3、5、7、9四次進步。可以記為預期收益為4。

如果我在第一次考0分,看起來我可以獲得2、4、6、8、10一共五次進步。可以記為預期收益為5。

但是如果所有人都考零分,那麼第一次考試等於作廢了,損失了一次機會,這樣一來提升名次的機會只有3-4次,預期收益記為3.5。

為了簡化問題,我們假設只有兩個人參加,所以第一次考試的博弈是這樣的:

所以非常明顯的是不存在納什均衡的。

上面的4和5的收益在雙人博弈中是完全確定的,因為一旦第一輪分出勝負,那麼後面的所有考試大家的最佳策略就是名次輪換。但在多人博弈中,會變得非常複雜。

同時我們可以注意到,如果一直不能分出勝負,最後兩個人的收益都是零,而如果在第一場考試中可以分出勝負,那麼將得到至少4次進步。

所以我們還可以得到另一個矩陣:

如果在第一次考試中,比別人考的低,那麼將可能獲得多一次的進步機會,所以收益是1,而如果在第一次考試中考的比別人高,則損失一次進步的機會,收益為0。而如果兩個人都考得低或者考得高,就可能同分而浪費一次考試的機會,所以收益是-1。

所以最終兩人博弈的結果是,第一次考試兩個人擲骰子決定自己考試的分數,確保與對方拉開差距,而從第二次考試開始,交替刷新排名來獲得最多的進步次數。

匆忙所想,若有錯漏歡迎指出。

@JoanneDu 的補充中有一個預設的前提,就是必須使自己進步最大化,也就是沒有比別人多進步一次和沒有進步一次是等價的,我認為這個前提不成立,正因為這個前提的不成立,所以有人可以願意讓出一次進步機會來謀求更多的進步機會。也使得一旦出現名次差異,那麼後面的博弈將是非常確定的交替進步模式。


我是針對 @Summer Clover的回答下面的評論來的。他提出的策略集合是一個NE,下面評論說不是NE的,請先回顧定義:在其他所有人的策略一定的情況下,我改變自己的策略不會使自己獲得更大的收益。

首先,我們一定要明確明確題主的假設條件,對於題主沒有說明的一些地方,我們需要明確地假設出來,否則任何論證都是搖搖欲墜的:1、10個人考10次,在此之前的考試都不算數,也就是summer說的,第一次考試沒有參照物,因此怎麼都不可能有進步;2、所謂的「進步」,不是指分數比上次考得高,而是名次比上次靠前;3、只計算進步次數,出現退步次數的不會影響最後結果,即進步一次算+1,,退步一次不是-1,而是0;4、如果出現並列的情況,考慮名次是按照「就前原則」,比如,如果大家都考同樣的分數,我們認為大家都是並列第一,而不是並列倒數第一。

非常值得注意的是,每個人在努力增加自己進步次數的同時,還得在一定程度上提防著別人進步,最起碼不能讓別人的進步次數超過自己。

summer提出的策略:前9次大家都考0分,分數是並列第一,最後一次隨便考。則所有人的進步次數都為0,最終結果是大家並列第一。也就是說,每個人的策略都是:前九局考0分,最後一局隨便考。如果在前9局的任意一局,有1個人想偏離,也就是考高一點,那麼在偏離的這一局他的排名仍然是第一(只不過由並列第一變成了只有自己是第一),並沒有進步,反而會導致在後面的局中,自己再也沒機會進步了(因為現在已經是第一名了),而別人有機會通過努力學習超過自己,那麼別人就可能取得排名上的進步。一旦這樣的情況發生,別人的進步次數就超過自己。這樣,原本他還可以保持所有人進步次數都為0,自己是並列第一的,可是現在別人進步次數超過自己,自己最多也就是個第二了。因此,他沒有動機偏離。在第十局,任何一個人想要偏離,也不會改變自己已經無法進步了這個事實,因此也不會給自己帶來任何收益,因而也沒有動機偏離。綜上,任何一個人在任何一局都沒有動機偏離,因而這是一個納什均衡。

summer指出的這個NE,在10個人的任何學習能力水平下都是成立的,即,不管這十個人是能力相當,還是有次序,還是壓根兒不清楚相對能力大小,這個結果都是一個納什均衡。

評論裡面有人非要說合謀的情況。如果想要使合謀的結果比summer提出的均衡更好,至少先要假設類似於「並列第一的人們平分所有的獎金」,這樣每個人除了想要多進步,還不想和別人的進步次數一樣,那麼在假設了每個人學習能力相對大小,又假設了每個人都可以將自己的成績自由控制在自己的能力區間(比如一個人的能力最高可以考80分,那麼他可以控制自己考0到80分的任意分數)的基礎上,可能會有這樣的結果:兩個學習能力最高的人合謀,約定兩個人輪流考第一,且必須每次都比那個學習能力第三高的人考得高。也就是,第一次,A1考第一,第二次反過來,於是A2進步一次;第三次再反過來,於是A1進步一次。到第9次結束,兩人各進步了4次,且第9次是A1取得了進步。第10輪,為了保證結果不變,仍需保證A1考第一,於是他倆都沒有人進步,最後並列第一。而剩下的8個人由於學習能力不夠,完全被這兩個學霸隔離了,他們8個自己在那邊博弈,無法撼動兩位學霸的地位(如此憂傷……)。但是,為了保證我設定的這個策略是一個納什均衡,還必須增加懲罰措施,比如「誰偏離了誰就得把得到的獎金全給對方」等等。然而一旦涉及到合謀,這就存在各種各樣的可能性,比如,剩下那8個人也可以合謀呀,他們全力配合,讓8個人中能力最高的人獲得8次進步,然後得到的獎金8個人平分。這個狀態能不能達到、是否有人想偏離,又取決於獎金的數量、各自的學習能力,等等一系列因素。所以我覺得……不對博弈規則進行詳細設定就在那邊一會兒討論合謀一會兒討論獎金都是在耍流氓……

———————————————————————————————————————————

最後,答完這個問題好心塞……因為這個問題本身太不切實際。就summer所說的均衡而言,顯然是個壞結果,大家都破罐子破摔,不好好考試。而如果想要增加別的假設條件來研究更多「更好」的均衡,又完全不符合實際。學習能力如何度量,如何比較,是否能成為common knowledge,即使都滿足了,又哪有人能自由控制自己考多少分,控制自己一定比誰考得高或考得低?

所以大家還是好好學習吧……畢竟我記得高中時候進步獎的獎金很少,比三等獎的獎金還要少很多……而且大學裡面你得個人民獎啊市獎啊國獎啊分分鐘幾千塊……加油啦啦啦

以上


所以廣大的人民群眾不採用這種方法評定。


這個遊戲是沒有必勝策略的,我們只能去追求次優策略,即所有人從第一次考試到以後的所有考試全都考零分,使得所有人都受益。


之前有一個遊戲,就是讓兩個參賽者比誰最慢到終點,兩個人就都慢騰騰的去了,這也是一樣的,沒有進步就是最大進步


策略?全班人都0分,全班都是第一。


我想到了日劇欺詐遊戲,當遊戲者試圖跳出個人圈子,通過合作以及欺騙,即使很普通的遊戲也是會往意想不到的方向發展的。

目前只是覺得通過合作或者欺騙的手段是可以達到理想的狀態,二人合作我想過了,不行。即使商量一個人先考100分,接下來一次那些考零分的也會考100以拿到一次進步名額,這樣合作者與非合作者沒有區別。可能在多人合作或多人欺騙可能會有出路,做到與每個人協商,假合作從而設計必勝法。要是想出來了我再補充。


推薦閱讀:

寒冷、關節炎與醫學邏輯
經典閱讀,還是論證訓練?——對中國的西方哲學教育的反思
有人說,社會主義是藝術不是科學,因為科學要從小白鼠身上開始實驗,怎樣反駁這種觀點?
「如果你……的話」,這裡的「的話」是什麼意思?

TAG:邏輯 | 邏輯思維 | 博弈論 | 邏輯學 | 運籌學 |