對於候選人來說,「10 人錄取 1 人」和「100 人錄取 10 人」兩種規則難度一樣嗎?

該理解為同樣10%的錄取率,還是理解為「打敗9人」比「打敗「90人」容易?


概率論數理統計學上有這樣的規律:總體樣本越大,概率越接近真實值(實力);總體樣本越小,隨機性影響越高。高票建模的回答(請參看 @ssynhtn Huang) 體現的就是這個思想,即實力越強,總體樣本越大越對自己有利;實力越弱,總體樣本越小越對自己有利。(建模結果請參看 @王贇 Maigo

溫馨提示:後面update有彩蛋哦!^_^
================================回答分割線,一下子收到這麼多贊,覺得自己還是要再編輯一下,回歸題主問題。

其實題主的這個問題就是高等數學概率論與數理統計課程中的大數定律。什麼是大數定律
大數定律(law of large numbers),是一種描述當試驗次數很大時所呈現的概率性質的定律。但是注意到,大數定律並不是經驗規律,而是在一些附加條件上經嚴格證明了的定理,它是一種自然規律因而通常不叫定理而是大數「定律」。而我們說的大數定理通常是經數學家證明並以數學家名字命名的大數定理,如伯努利大數定理。

在隨機事件的大量重複出現中,往往呈現幾乎必然的規律,這個規律就是大數定律。通俗地說,這個定理就是,在試驗不變的條件下,重複試驗多次,隨機事件的頻率近似於它的概率。比如,我們向上拋一枚硬幣,硬幣落下後哪一面朝上本來是偶然的,但當我們上拋硬幣的次數足夠多後,達到上萬次甚至幾十萬幾百萬次以後,我們就會發現,硬幣每一面向上的次數約佔總次數的二分之一。偶然中包含著某種必然。----------------------------------------------------(以上內容來自百度百科)

所以題主為什麼覺得10/100比1/10困難?就是因為1/10偶然性、隨機性較大,實力不足者更能利用這種隨機性和偶然性(其實就是運氣)獲得成功,也就是對實力強者很有不利;而10/100卻更能體現出自身實力來,隨機性和偶然性影響相對較小,實力不足者自我實現更難,而對實力強者有利。當然,這個解釋的前提是人群的能力表現是按照正態曲線來分布的,並且這個分布也是符合自然規律的。

總結:題主關於「該理解為同樣10%的錄取率,還是理解為「打敗9人」比「打敗「90人」容易?」這個理解我個人認為是片面的。假如把100人分為10組,每組選出勝出的1人,雖然最終計算概率是10/100,但是實際勝出的人只需要打敗同組9人即可。所以,討論10/100難還是1/10容易的問題,還必須設定前提條件:實力問題和分配原則(或者說方式,前面說的選出10/100,是按照100人同時比賽方式還是按照分10組每組選1人的方式),脫離了這兩個條件的討論是沒有意義的。

後記:這裡所說的隨機性和偶然性,我認為就是日常生活中說的運氣,幸運。總結起來,獲得成功的因素有兩個:實力和運氣。(完)

回答更新分割線====================================================================================================================================================

2015年12月17日update

對原答案做如下幾點補充:


總說明:

  • a.以下補充未在額外說明的情況下均默認人群能力是在符合正態分布模型的前提下討論,即認為人群能力分布中間者居多,能力較強和較弱者分布較少的中間大,兩邊小的分布。
  • b.在用數學模型討論時,所有數據均用客觀性評價,即僅從數學的角度討論,不討論其他因素(例如家庭關係、人脈等等)的樣本結果的影響。

1.為了直觀說明1/10和10/100的錄取難度,現建立這樣一個模型:

人群能力均勻分布在(0,1)之內並且相互獨立,以0.01的長度計算,即能力在0.00,0.01,0.02……0.98,0.99,1.00(用x表示)的100種情況下在每種情況下被成功錄取的概率,並繪製出曲線。

對於1/10招錄比例來說,成功錄取要打敗其他9個人,而每次成功概率為x,那麼成功概率為:

P=x^{9}

對於10/100來說,成功錄取要至少打敗其他90個人,即錄取可能性為打敗90人,91人,92人,93 人……98人,99人,求和即可得到。而每次成功概率為x,那麼成功概率為:


P=sum_{i=90}^{99}{C} _{99}^{i} x^{i} left(1- x 
ight) ^{99-i}

繪製出兩種情況的概率分布曲線為:

由曲線可以看出,在相同的概率下,1/10對能力弱者和中等能力有利,10/100對能力超強者有利。

2.為了更直觀的說明大數定理,用MATLAB做了一個圖.

從圖像上看:同一個樣本容量分布,取不同數量的樣本數量研究得到結論是不同的,取10個樣本時,隨機性的影響特別大,幾乎是亂序的,而取100個樣本時,雖然與隨機性影響,但是樣本分布基本滿足正態分布中間大,兩邊小的特點,因此,取無窮個樣本時,樣本分布完全滿足正態分布形態。這裡說一下中心極限定理,被認為是(非正式地)概率論中的首席定理,設從均值為μ、方差為σ^2;(有限)的任意一個總體中抽取樣本量為n的樣本,當n充分大時,樣本均值的抽樣分布近似服從均值為μ、方差為σ^2/n 的正態分布。


3.對人群能力分布建模

取兩組數據,兩組數據能力最弱者為0,能力最強者為1,樣本均值均為0.5

第一組樣本分布在(0,1)之間10個樣本,相鄰樣本為0.1個長度即樣本為

0.0,0.1,0.2……0.9,1.0

MATLAB計算標準差σ = 0.3317,

按照正態分布表示為N(0.5, 0.3317^2)在區間(0,1)分布

第二組樣本分布在(0,1)之間100個樣本,相鄰樣本為0.01個長度,即樣本為

0.00,0.01,0.02……0.99,1.00

MATLAB計算標準差σ = 0.2930

按照正態分布表示為N(0.5, 0.2930^2)在區間(0,1)分布

用MATLAB繪製N(0.5, 0.3317^2)和N(0.5, 0.2930^2)在區間(0,1)的正態分布圖像為下圖所示:

概率密度函數為正態分布的期望值μ決定了其位置,其標準差σ決定了分布的幅度。從圖像和計算數據可知,10個樣本數據分布更加矮胖,即更加離散,隨機性的影響相對於100個數據樣本更大。這裡說的隨機性影響更大的說從無窮樣本庫:能力最弱者為0,能力最強者為1,樣本均值均為0.5的區間(0,1)之內無窮個數據取出10個數據樣本隨機性大於取出100個樣本的隨機性,取出10個數據相鄰數據間隔長度更大,不均勻可能性更大。舉例一項考試,招錄比例為1/10和10/100,那麼1/10更有可能取到1個能力超強,其他9人能力超弱的組合。

4..隨機性的影響有三層含義。


a.從樣本總體容量大小的角度看。


結合1和2以及大數定理,樣本容量越小,獲取的樣本表現標準差越大,隨機性越大。反之樣本容量越大,樣本數據離散程度越小,隨機性越被弱化,樣本越服從樣本的總體規律表現,這裡的隨機性可以理解為樣本之間偏差大小,無序性和無規律性的程度。

b.從樣本個體之間能力表現的角度看。


樣本個體之間的能力越接近或者說偏離程度和間隔長度越小,隨機性的個體的成影響越大,而這種影響往往是致命的。為了更好的說明,我舉個例子:

乒乓球是中國國球,在我國長盛不衰,大多冠軍被中國拿走,乒聯於是做了一系列改革,像11分制,小球換大球,無遮擋發球等。以前是22分制,改革後為11分制 ,局數減少,增加了比賽的偶然性和隨機性,其實這些改變都是針對中國選手,增加了比賽懸念,提高了比賽觀賞度.但這主要是想減少中國對乒乓球的壟斷。同樣情況的還有針對中國的羽毛球聯賽規則改革。


c.從樣本個體本身能力表現的角度看。


當樣本個體能力確定時,建模時常常忽略個體能力的表現,並不是個體的能力表現好,個體的結果表現就一定符合能力值,比如高考超長發揮,正常發揮,失常發揮,這也是隨機性的一種表現形式這裡的隨機性就是幸運值,建模很難體現出來。比如有不少高考狀元坦言,自己平時模擬考不都是年級第一,具體例子可以百度:浙江高考理科狀元李樂 平時班裡排十幾名,2014年四川高考理科狀元封凡從未拿過年級第一等等。

5.總結分析:


a.從現實實際情況來看,1/10和10/100這個比例常常是達不到規定招錄比率的。例如以國考為例中新網北京11月30日電 29日下午17時,2016年國考公共科目筆試正式落幕。據統計,本次考試共有139.5萬人通過招錄機關資格審查,近93萬人實際參加考試,超46萬人「棄考」。所以實際比例是趨向改變的。

b.建議能利用其它因素(例如家庭關係、人脈等等)的參賽者選擇參賽人數少的考試。比如10/100情況下,你考20名,刷去10人難度大於而1/10時,你考第5,刷去4人的操作難度。

c.建議我們大多數人參加錄取人數多的比賽。對於我們大多數人來說,參加10/100的比賽,自己可以控制的空間比1/10大,也就是公平性越大。

d.對於隨機性的影響,隨機性的具體表現可以理解為幸運值。但是隨機性這種事,掌握在上帝手中,對於幸運值的來說,我想:

越努力,越幸運;

而以我們大多數人努力的程度,根本還沒到拼智商的地步;

同樣的以我們大多數人努力的程度,遠遠沒有到拼幸運的地步。


我把 @ssynhtn Huang的結果畫成了圖:

橫軸x是你的實力的百分位數,0表示最差,1表示最強。縱軸P是入選概率。
藍線是10選1的情況:P=x^9
紅線是100選10的情況:P=sum_{i=0}^9 C_{99}^i cdot (1-x)^i cdot x^{99-i}
可見,在入選比例一定的情況下,實力越強,候選人多的情況就越有利。上圖中藍線與紅線的交點的橫坐標在0.8912至0.8913之間,並不等於0.9。


從你的角度考慮可能是不一樣的。
我給一個簡單的模型:
假設每個人的實力都是落在0~1之間的一個實數,並且是一個均勻分布,你的實力為a,然後從茫茫人海中找出9個或99個競爭對手,你的目標是在總人數中排行前10%
那麼,如果總人數為10,你需要打敗所有其他9個人,唯有其他人的實力都小於你:
P = (1-a) ^ 9
如果總人數為100,那麼實力超過你的人數只能為0,1,2....9(大部分人的實力都必須小於你)
P = sum_{i=0}^{9}{C_{99}^{i} * (1 - a)^{i} * a^{99 - i}  }

計算結果(也許有誤,沒仔細檢查)
my power: 0.1
win in 1 out of 10: 1.0000000000000005E-9
win in 10 out of 100: 6.780782951632995E-79
ratio: 1.4747559494721382E69
=================================
my power: 0.2
win in 1 out of 10: 5.120000000000002E-7
win in 10 out of 100: 2.9488580680283526E-52
ratio: 1.736265320976708E45
=================================
my power: 0.3
win in 1 out of 10: 1.9682999999999994E-5
win in 10 out of 100: 6.36514316477251E-37
ratio: 3.092310650439779E31
=================================
my power: 0.4
win in 1 out of 10: 2.621440000000001E-4
win in 10 out of 100: 2.8604308988672206E-26
ratio: 9.164493367199103E21
=================================
my power: 0.5
win in 1 out of 10: 0.001953125
win in 10 out of 100: 3.0265671284731364E-18
ratio: 6.453268396479698E14
=================================
my power: 0.6
win in 1 out of 10: 0.010077695999999997
win in 10 out of 100: 5.737004844293746E-12
ratio: 1.7566127750482337E9
=================================
my power: 0.7
win in 1 out of 10: 0.04035360699999998
win in 10 out of 100: 5.021897606093991E-7
ratio: 80355.29627492113
=================================
my power: 0.8
win in 1 out of 10: 0.13421772800000006
win in 10 out of 100: 0.002669842983169096
ratio: 50.271768357210284
=================================
my power: 0.9
win in 1 out of 10: 0.3874204890000001
win in 10 out of 100: 0.46447670012445275
ratio: 0.8341010192679071
=================================


可見,當你比較弱的時候,10人中勝出的可能性更大。
當你的實力達到0.9的時候,100人中勝出的可能性更大。

~~~~~~~~~~~~
關於實力的分布:
上面的這個計算方法可以拓展到任意分布。
現在假設實力的分布是一個R上的正態分布N(u,sigma),其密度函數為p(x),分布函數為F(x)
假設你的實力為a,那麼從茫茫人海中隨機取一個人,他的實力小於你的可能性為P(x&如果a=u, 那麼就是0.5,如果a=u+3*sigma,就是0.9985。
這樣如果接受每個人的實力都是相互獨立的假設,接下來的計算過程就是一樣的。
如果你的實力比平均水平高一個標準差
a=u+sigma
my power: 0.84134
win in 1 out of 10: 0.21122427806181596
win in 10 out of 100: 0.03717881939691425
ratio: 5.681306762509705
=================================
a=u+2sigma
my power: 0.97725
win in 1 out of 10: 0.8129261834819175
win in 10 out of 100: 0.9999084879391249
ratio: 0.8130005828407458
=================================
a=u+3sigma
my power: 0.99865
win in 1 out of 10: 0.9879154037464456
win in 10 out of 100: 0.9999999999999997
ratio: 0.9879154037464459
=================================

~~~~~~~~~~~~~~~~~~~~~~
順便貼一下Java代碼=.=
計算組合數就直接用長整型了,C(99,9)差不多恰好沒溢出...

public class Competition {

static long NUM_ALL = 100;
static long NUM_COMP = NUM_ALL - 1;

static long NUM_ALL_SMALL = 10;
static long NUM_COMP_SMALL = NUM_ALL_SMALL - 1;

static double ME = 0.5;
static double LOW = ME;
static double HIGH = 1 - ME;

public static void main(String[] args) {
if(args.length &> 0){
ME = Double.parseDouble(args[0]);
LOW = ME;
HIGH = 1 - ME;
}

compete();

}

static void compete(){
double winInTen = Math.pow(LOW, NUM_COMP_SMALL);

double winInHundred = compute();

double ratio = winInTen / winInHundred;

System.out.println("my power: " + ME);
System.out.println("win in 1 out of 10: " + winInTen);
System.out.println("win in 10 out of 100: " + winInHundred);

System.out.println("ratio: " + ratio);
System.out.println("=================================");
}
static double compute(){
double res = 0.0;
for(long i = 0; i &<= 9; i++){ res += choose(NUM_COMP, i) * Math.pow(HIGH, i) * Math.pow(LOW, NUM_COMP - i); } return res; } static long choose(long n, long k){ long res = 1; for(long i = n; i &>= n - k + 1; i --){
res = res * i;
}

return res / fact(k);
}

static long fact(long n){
long res = 1;
for(long i = 1; i &<= n; i++){ res *= i; } return res; } }


有意思。

回想起我的幾次公務員考試。

第一次是國家公務員考試,只招1個,190多個人報名,面試比例4比1,我是筆試第3,面試第1,最後上岸。

第二次是江蘇省公務員考試,只招1個,200多個報名,面試比例3比1,我同樣筆試第3,放棄面試。

第三次是市委面向全市在職公務員遴選,180多個報名,招2個,筆試前10名進面,我筆試第10,最後總成績第2。

第四次是現單位面向全國在職公務員遴選,1400多個報名招11個,筆試前55名進面試,我最後是11人之一,排第幾不知道。


對我個人而言,明顯後來的崗位更好考,當我決定報名時,我就清楚知道自己能考上。比如最後一次考試,我考前一天看考場,所有報考人員名單都在牆上貼了一溜,我當場電話跟家人說,競爭挺激烈,1400多個考10個。我媽糾正我,不是11個嗎?我說有一個肯定是我。

原因無他,我對自己的實力還是比較自信的,但是如果只招1個2個,保不齊還有高手或者自己發揮不好讓別人考上。但是招11個,哪怕競爭人數再多,也只是金字塔的底座而已,構不成實際威脅,也給自己一個緩衝的空間,即自己打個盹,也能贏。

所以個人覺得,100取1,偶然性更大一些。1000取10,對高手來說是更有利的。

安利一下
那些年輕的時候就得了大病或是絕症的人是怎樣的感受? - 知乎用戶的回答

你有哪些獨特的識人技巧值得分享? - 知乎用戶的回答


上面的高票回答很專業,我就直白地說一點。
比如世界盃,每小組4支球隊,前2名晉級,結果經常有強隊爆冷出局,也經常有弱隊爆冷晉級,假定世界盃的賽制是32支球隊同在一小組,取前16名,那麼爆冷的機會還有那麼大嗎?

首先說,10取1和100取10的比例是一樣的,都是1/10,也就是說系統整體的難度是一致的,如果篩選機制是隨機抽取的話,那兩種情況無區別。
其次,考慮到個體差異,10取1的樣本較小,所以受偶然因素影響較大,而100取10則受影響較小。這裡的偶然因素可能包括自己的發揮、對手的強弱甚至潛規則影響等等。因此,如果你實力頂尖的話,那麼100取10更有利,實力平庸的話,10取1會增加你爆冷的機會。
但這些只是部分影響,終歸你還是要增強自己的實力,這才是根本。


結合這自己最近剛剛看的部分概率論知識,總結下排名第一 @ssynhtn Huang 的答案以及目前看到的答案。

概率複習當中,打算半年內再次更新本文。[2015年6月20日]

問題可以一般化為:
對於n個候選人,按照某種規則選擇m個候選人,其中某人被選中的概率p是多少。

規則:候選人按照得分從高到低排序,選擇前m個候選人。

假設:
假設n個隨機變數X_1, X_2, ldots, X_n分別為n個候選人的得分,具有相同的分布,其分布函數為F(x),密度函數為f(x)

其中某一位候選人(稱之為A)被選中的情況是:其排名kleq m
下面來計算這一概率,首先計算A的排名為k的條件概率。

A的得分為X=x,並且其排名為k,則有

  1. (k-1)位候選人的得分高於x,其對應的概率為left[1-F(x)
ight]^{k-1}
  2. (n-k)位候選人的得分低於x,其對應的概率為F(x)^{n-k}

發生一次這樣特定的序列(arrangement,這個詞對應著中文的什麼)的概率為left[1-F(x)
ight]^{k-1}	imesleft[F(x)
ight]^{n-k},一共有frac{(n-1)!}{(k-1)!cdot1!cdot(n-k)!}種這樣的序列。


綜上可以計算出當候選人A得分為X=x時,其排名為k的概率:

p(R=k|X=x) = frac{(n-1)!}{(k-1)!cdot(n-k)!}left[1-F(x)
ight]^{k-1}left[F(x)
ight]^{n-k}

由此可以得到候選人A被選中的概率為:

p_A(x)=sum_{k=1}^{m}p(R=k|X=x)

很顯然,候選人A被選中的概率與得分X的分布相關。

圖中表示100個候選人中,選擇10個人時,候選人A被選中的概率與其得分之間的關係,其中藍色的線是表示柯西分布的情況,綠色的線是正態分布的情況。

說明:
1. 得分進行過歸一化(normalization)處理,處理的方式為
x = frac{x - ar{x}}{s}
2. 圖中只繪製了得分大於零的情況(對應著above average),至於得分小於零的情況,說明該候選人處於劣勢,其能被選中的概率微乎其微,暫不考慮。

可以發現:
1. 隨著得分增加,該候選人被選中的概率也相應的增加。
2. 由於正態分布的尾部比柯西分布收斂得更快,故要以相同的概率被選中,柯西分布需要更高的得分。可以推斷:當所有候選人的得分更分散時,某位候選人需要更高的得分,才能維持選中的概率。
目前,已經求得候選人A被選中的概率與其得分之間的關係。下面再來分析題主所問的情況:

  1. 從10個人中脫穎而出,被選中;
  2. 從100個人中脫穎而出,被選中。

先看下直觀的結果,然後再來解釋。

可以看到,當得分不太理想(較小)時,從10個人中勝出的概率更大一些;當得分較高時,從100個人中爭取10個名額中的一個,更具優勢。

另一方面, 雖然得分較低時,從10個人中勝出的概率更大,但這種可能性卻不超過0.375(圖中的交點,對應的得分約為1.231231)。

更進一步:
下面再來討論一個殘酷的結論
假設在100人中選出10人的方案中
1. 某候選人比90%的人都優秀(對應的得分大概為1.2815),但其被選中的概率卻不及0.47,居然不到0.5;
2. 若候選人比91%的人優秀,其能夠被選中的概率增加到0.60;
3. 若候選人比92%的人優秀,其能夠被選中的概率上升到0.73。
4. 當足夠優秀時,比94.3%的人都優秀的時候,別選中的概率才會超過該候選人排名所對應的值。

優秀的程度 0.890 0.900 0.910 0.920 0.930 0.940 0.950 0.960 0.970 0.980 0.990
選中的概率 0.340 0.464 0.600 0.732 0.845 0.926 0.973 0.994 0.999 1.000 1.000

&<知乎如何插入表格&>

當很優秀,卻不夠優秀時,通過努力,能夠使自己突飛猛進;此時,若稍微鬆懈一點,有可能失去很多。

比90%的人優秀,卻又不夠優秀的人,往往能夠感覺到自己很優秀,卻苦於付出跟得到不成比例,些許也能從這兒得出部分解釋。

沒心情寫了&>_&< 部分問題:
10個人勝出一個的情況,正態分布的假設不適用,可以改用t分布,未來半年內修改。

部分評論的解釋:[2015年06月22日]
1. 歸一化。在我認為,歸一化對應著normalization,歸一化後的結果不一定在[0,1] 之間,見鏈接:
a. https://www.utdallas.edu/~herve/abdi-Normalizing2010-pretty.pdf 第3頁
b. https://en.wikipedia.org/wiki/Normalization_%28statistics%29
c. 常用的指標歸一化的方法有哪些? - 數據分析
2. arrangement的翻譯。arrangement一詞是出現在John Rice 的「Mathematical Statistics and Data Analysis」一書,在page105討論順序統計量的概率密度函數時,用到該詞。查閱了下書籍,在其對應的中文版翻譯(見參考文獻2)中,該詞翻譯為「排列」;陳希孺先生的《概率論與數理統計》一書,第56頁,討論多項分布時,使用序列,覺得甚妙,遂用之。

參考文獻:
1. John Rice 2007, Mathematical Statistics and Data Analysis, 3rd edition, Brooks/Cole.
2. 田金方(譯)2011, 數理統計與數據分析(原書第三版),機械工業出版社。
3. 陳希孺 2009, 概率論與數理統計, 中國科學技術大學出版社。


在中國這種關係社會,100人錄取10人最後的真實錄取率可能是5-6%,而10人錄取1人卻大多數多是0%…


感覺是很有趣的問題,雖然答主是高中概統水平還是強答一發。高票答案中已經有很多優秀的回答,這裡我結合實際生活中的案例分別建立合適的模型,目前只寫了兩種情況,如果之後想到其他的情況會陸續更新,因為真的是很有趣的問題。

  • CASE 1

現實案例:

答主所在的城市有個叫南外的中學,小升初錄取學生的時候是這樣操作的: 1. 學生自由報名。2. 在報名學生中進行搖號隨機抽取一定量的學生給予考試資格(例如抽100人或10人)。 3. 在參加考試的學生中擇優錄取(例如錄取10人或1人)。

抽象數學問題:


有一個人數為N(N遠大於100)的群體(對應現實案例中自由報名的學生群體)。從這個群體中隨機抽取100人或10人參加考試,分別擇優錄取10人或1人。已知自己在N人群體中的實力排名(例如大概排在前百分之多少),將這個實力量化為x(稱為實力指數,下文多次用到),x的意義是比群體中(除自己以外)多少比例的人強,比如如果x=0.5,那麼表示你比群體中50%的人要強,所以x在[0,1]區間內。求被錄取的概率。

數學模型求解:

@ssynhtn Huang 的高票答案屬於這種問題的數學模型。不過個人覺得沒有太大必要討論N人群體是均勻分布還是正態分布或是其他分布。因為我們已知的是自己在群體中的排名,如果我比90%的人強,那麼從N人中隨機抽取一個人比我弱的概率就是90%,不管整個群體是個怎樣的分布。最終被錄取的概率公式黃同學也非常漂亮的給出了,在此就不做贅述,這裡我將100人和10人的兩種情況合併如下:
P(x)=sum_{i=0}^{n-1} C_{m-1}^i (1-x)^icdot x^{m-1-i},
其中m是參加考試的人數(100或10),n是錄取的人數(10或1)。x是自身的實力指數,代表實力排N人群體中前百分之多少,值在[0,1]區間內。

結果 @王贇 Maigo同學也畫出來了,這裡為了便於自己表述,我重新畫了一張如下:

將兩條曲線做差可以得到下圖,在0以上表示應該選擇10人情況,在0以下表示應該選擇100人。

從以上結果可以得出以下結論:
Case 1 結論:
1. 實力較強者更適合參加考試總人數多的,反之實力較弱者適合總人數少的。

2. 如果自身能力菜不管選什麼策略都是被虐。從第二張圖可以看出,只有當自身實力達到一定程度後,兩種情況才會對最終勝算有較顯著的影響。如果實力還達不到足以擊敗N人群體的77%,那麼即使選擇對弱者而言較有優勢的10進1其勝算也難以達到10%。

3. 對於實力x大約在[0.8, 1]的同學來說,臨場發揮非常關鍵。拿實力為0.9,參加100人考試的同學舉例,如果他能超常發揮1%,那麼他的勝算將能提升13% - 14%。(當然如果N人群體實力是正態分布,那麼把實力從0.9提升至0.91也沒有看上去那麼容易)

Case 1 的局限性:


CASE 1中,由於是隨機從N人中抽取一定量的人參加考試,所以能不能參加考試不取決於考生本身的選擇。但是一種更普遍的情況是考生有自主選擇報名考試和不報名考試的權利,並且對於很多考試,是可以參加多次的,所以考生在沒有把握的前提下,通常會選擇暫時不報名,等準備好了再報名(可能有人會考慮反正能考多次,應該不管准沒準備好都去考考試試,在case 2 中會有更詳細的設定來防止這種心態的發生)。這種情況下,就不能假設參加考試的人是從N人群體中隨機抽取的了。實力強的人會更傾向於報名考試,換句話說,這種考試的考生會比隨機抽取的考生整體實力強。我的第二個模型就是加入了考生報名時的心態影響因素,詳情請看下面的CASE 2。

  • CASE 2

現實案例:


答主在12年的時候參加過叫GRE的萬惡考試。當時的規定是這樣的:理論上可以考多次,但是首先每考一次都需要交一筆上千人民幣的考試費,第二,申請學校時需要上報所有歷次的成績(現在這個規定改了)。所以當時很少有人在沒準備好的情況下去勉強碰運氣,一來浪費錢,二來考出低分也會影響申請結果。GRE雖然不是擇優錄取的考試,但是給分是按照同一批考生的成績分布給分的,為了和題主的問題匹配,這裡大家就想像成需要考到前10%才能申請到理想的學校。

抽象數學問題:


有一個人數為N(N遠大於100)的群體,群體中的每個人自主選擇報名或不報名本次考試。考生自身的實力會影響考生是否選擇報名考試,實力較強的人更傾向於報名,相反實力弱的傾向於放棄報名。已知自己的實力指數x,分別求100進10和10進1被錄取的概率。

數學模型求解:

在假設已知自身實力的情況下,每個人會估計自己的勝算來決定是這次考還是等變強後下次再考。於是他們機智的打開了知乎,搜到了這個問題,看到了高票的回答,即CASE 1中的結果。現在我們合理假設他們報名考試的概率和CASE 1中勝算曲線是一致的,即如果他們實力所對應的勝算越大,那麼他們越有可能報名考試,越有可能出現在考場中。基於這個假設,現在我們設一個分布和勝率曲線一樣的概率密度函數f(x),如下:

f(x)=acdotsum_{i=0}^{n-1} C_{m-1}^i (1-x)^icdot x^{m-1-i}

f(x)中我乘了一個常數a, 可以通過令f(x)在[0, 1]區間上的積分為1解得。解得對於100人和10人的情況a都等於10。通過對概率密度函數積分可以得到概率分布函數F(x):

F(x)=int_{0}^x10sum_{i=0}^{n-1} C_{m-1}^i (1-xi)^icdot xi^{m-1-i}dxi

這裡F(x)的物理意義是:參加考試的隨機某個同學他的實力低於x的概率。為了方便理解,這裡拿case 1做下對比,在case 1中,由於參加考試是隨機的,所以概率密度函數f(x)是常數,積分後得到的F(x)是線性於x的,所以對於case 1,F(x)=x。現在假設我們自身的實力指數為x, 那麼我們能夠擊敗參加考試的隨機某個同學的概率是F(x)。為了求被錄取的勝算,我們只需要把case 1 中的P(x)式子中的x替換成F(x)就可以了。

我按照上述的方法計算了新的勝算分布,結果驚了。結果顯示即使自身實力達到0.99,勝算也才接近50%。個人感覺不太符合實際情況。我思考後感覺上述方法有以下和現實不符的地方:

a. 現實中不可能知道自己準確的實力指數,一般只是個大概的區間範圍,因此在估算自己勝算的時候,也是一個範圍。
b. 從我自身的想法出發,在勝算不是很低的情況下,我更傾向於去嘗試參加考試,寄希望於自己稍微超常發揮,換句話說,我報名考試的概率會比上述方法得出的高。

綜合上述兩點,我對模型進行了修改。(但是改的很粗糙啊!)

首先是對概率密度函數f(x)的修改,新的f(x)我定義為:

f_2(x)=frac{a}{0.2} int_x^{x+0.2}cdotsum_{i=0}^{n-1} C_{m-1}^i (1-xi )^icdot xi^{m-1-i}dxi   (x<0.8)
f_2(x)=frac{a}{1-x} int_x^1cdotsum_{i=0}^{n-1} C_{m-1}^i (1-xi )^icdot xi^{m-1-i}dxi   (xge0.8)

上式用語言來描述就是現在我對自己的實力定位是一個[x, x+0.2]或[x, 1]的區間(分別對應x&<0.8和x&>=0.8),等於是求了這個區間內的平均。之後就是和之前一樣的步驟,將f(x)積分得到概率分布函數F(x),並帶入P(x)。結果如下:

和case 1的結果相比,很明顯競爭更加激烈了,勝算也減小了很多,因為這次參加考試的都是有備而來,整體水平較高。但是整體趨勢還是和case1相同。Case 2 結論:
1. 策略的選擇對於結果的影響更小了,100人和10人的結果非常接近。
2. 臨場發揮的重要性更大了。這是由於參加考試的人中高手較多,容不得犯錯。
3. 相比於case1,case2更是強者的遊戲,有勝算被錄取的實力要求大大提高。


假設比你強的人概率是p,m人里選n人,那麼就是二項分布B(m-1,p),成功次數小於n的概率。顯然m,n等比例變換結果會不同。
不過m,n都很大的情況下,等比例改變m,n概率就幾乎不變了,因為中心極限定理。


不一樣。
因為社會上還有其他人。
但是10中取1,就不給其他人留餘地了。
100中取10,至少後面2-10名還是給其他人留的餘地。
如果要說明白點,我的意思是:
10中取1的意思其實是9個人陪太子讀書。
100取1的意思是90個人陪太子讀書,9個人去做長工。
不知你明白了沒有。


生活不是數學,它不可約分。


樓上答主從參選者的隨機性上回答的都不錯,我從另一方面補充下吧,除了參選者自身能力差別以外,評委本身對選手能力的認知也是有偏差的,假設選手能力從0到100均勻分布,那麼10選1會出現評委在一個99的和一個98的選手之間最終選擇了98的選手(太相近而容易誤判),但是在100選10的情況下,由於分數線會接近90,因此99和98都很容易入選(當然90和89之間還是看臉),從這方面考慮一個100選10的競賽對於選手來說結果會更加接近自身實力,而10選1偶然因素太大,更適合於拼運氣


不一樣,十個人中選一個,哦天!那個人肯定不是我!一百個人中選十個,我一定是十個中的一個!


不一樣,你沒法打敗有後台的,百錄十容易多了……


我和劉國梁打乒乓球,打1個我 贏的概率有10%以上(就強行弄擦邊球),打11個我贏的概率十萬分之1都沒有


「拿第一」
「進前十」

這兩個你覺得哪個更難?


取十個:八個關係,一個直系,一個能力競爭上崗
去一個: 一個關係


除了上面說過的概率因素,還有其他現實中的細節因素有影響。比如,10取1時可能有三個面試官審查你們10個人,但你覺得100取10時真的會有30個面試官審查你們100個人嗎?現實中顯然是不可能的。於是100取10的話面試官在每個候選人身上均攤的精力很可能要偏低了,這樣的影響就是,一些抓眼球、搏出位之類的技巧、策略可能(注意也只是可能,具體情況具體分析)更有效——也就是說即使忽略實力因素,我們這時的應試策略已經可能有必要做出調整了。


好了,答案前三已經說了,沒啥可說的了

不過如果是公務員考試,錄取1個還是10個完全取決於領導的親戚的繁殖能力


肯定不一樣。

10人錄取一個,幾乎就是蘿蔔坑。或者,只要出現蘿蔔你就醬油了。
100人錄取10個,哪怕有幾個蘿蔔,你還是有機會的。

還有一點,後者有可能出現分母不到100人的情況非常大,比如遲到,自己放棄啥的。


我反正深有體會,我更喜歡100000選1000個,比如,本省的高考。。。


推薦閱讀:

基於次線性期望(Sublinear expectation)的概率論體系有何價值?
如何求出正態分布的尾部期望?
動物保護主義會造成偷獵增加嗎?
是否許多變數可以用正態分布很好地描述?如果是,為什麼?
從零開始學數據分析,什麼程度可以找工作?

TAG:統計學 | 概率論 |