標籤:

辛普森悖論(分項的平均值都比較大,可為何合項的平均值反而較小)?

數學教授肯·羅斯提出一個問題,在1995、1996、1997年的三年時間裡,大衛每年的擊球率都高於德里克,但是,在把三年的數據集中在一起的計算的時候,卻發現德里克的擊球率要高於大衛。

  1. 1995 1996 1997 合計
  2. 德里克12/48 0.250 183/582 0.314 190/654 0.291 385/1284 0.300
  3. 大衛 104/411 0.253 45/140 0.321 163/495 0.329 312/1046 0.298

正如上表所示,每一個單獨年份B選手的成績都要好於A選手,可合計起來,卻是A選手好於B選手,這如何解釋??
這種現象如何解釋,反應了平均值的何種內在缺陷。


這個不是悖論,很正常的統計現象。
舉另外一個例子就比較容易理解了:
有甲乙兩個班,每個班裡的學生都分為好生和差生2類,甲班的好生平均分是90分,乙班的好生平均分是95分,乙班高;甲班的差生平均分是60分,乙班的差生平均分是65分,也是乙班高。但是甲班的總體平均分卻比乙班高,為什麼呢?因為甲班好生比例比乙班高啊(比如甲班50個好生,20個差生,乙班20個好生,50個差生)。


參見這篇博文 辛普森悖論:詭異的男女比例


注意這個是什麼的平均值!是一個率!是一個商!就好比我科每場比賽命中率都沒有哈登高 但我科只要在命中率高手感好的那場多投幾個球 嘿嘿 全賽季的命中率就上來了


一.這不是悖論

二.男生兩個科系的錄取系均低於女生不能推導出,總體錄取率將低於女生,因為男女兩個科系的權重係數不一樣.

三.認為悖論是人的慣性思維的誤導,只要計算一下就可以得知差異在什麼地方.


四.計算展開:

1. 地理系男生的錄取率為0.75,女生的錄取率為0.8,但地理系男生的權重是0.62,總體錄取率是0.46,地理系女生的權重是0.38,總體錄取是率0.31.加計權重後的結果是地理系男生總體錄取率高於女生0.15.

2. 最終男生高出女生的錄取率,是歷史系與地理系的差異-0.08+0.15=0.08(尾差四捨五入)


3. 如果兩科系的男女基數總體基是一致的將會很好理解,否則要計算一下才知道差異所在.


wikipedia 的例子還蠻好懂的:
https://zh.wikipedia.org/wiki/%E8%BE%9B%E6%99%AE%E6%A3%AE%E6%82%96%E8%AE%BA


推薦閱讀:

怎麼做才能把圓周率改成3.15?改完以後世界會是啥樣??
最多多少正三角形可以組成近似球體?
自由運動怎麼才能得到最大面積?
如何自學高等數學?什麼教材比較好?

TAG:趣味數學 |