為什麼WS值不能用來衡量兩名球員的表現好壞?

之前就說過,要正面剛一剛@數據Simon的那套WS來衡量球員能力和歷史地位的理論。現在把反駁的一些觀點整理成比較系統的內容,獻給所有看客,就當瞧個熱鬧。

鑒於數據哥已經被封號了,所以在此拜託曾經被數據哥委託傳聲的 @MichaelChan 、 @kobezhaojing 以及在zhihu.com/question/6338 問題下也發布了數據哥的聲明的某位匿名的朋友,歡迎你們幫數據哥傳達對於我文章里所表達觀點的意見。

以及在上述提問下面發布過回答的 @雨中聽雪 、 @awpwyx 、 @哥舒夜 、 @秒速五厘米 、 @日月星峰 、 @EDCBA 等其他說「詹密們辯理辯不過就在這兒耍舉報的陰招」的朋友,先聲明幾句話:

  1. 詹密少,且正面懟數據哥的人的回答,很容易被一些極端粉絲給踩下去,你們看不到;
  2. 理論錯誤需要系統性的理論解釋來批駁,這個功夫不是誰都有的。 @一方總隊長 在自己的回答中曾經很系統地指出過數據哥的錯誤,而數據哥的回應很明顯是顧左右而言他,這其實是心虛的表現。
  3. 你們說詹密聯合舉報就被封號,空口無憑。數據哥說個什麼結論還會找找實例來支持。建議你們的知乎勇密群,集體去舉報一個正常回答,看看會不會把別人的號封了,如果真的封了,你們不是更找到了一個為數據哥申訴同時狀告詹密的鐵證么?

正文開始

=============================================

0、前言

關於WS的定義和計算方法,BBR上給出了定義,這是許多籃球數據愛好者,包括數據Simon都會經常使用的一個網站。

basketball-reference.com

嫌看英語麻煩的朋友,可以參考天涯的一篇帖子,是中文翻譯版。

怎樣計算球員進攻勝利貢獻值_籃球公園_天涯論壇_天涯社區

我在這裡也會給出中文的計算過程。

證明過程略長,耐心稍差的朋友,或者對數學運算看不懂或沒興趣的朋友,可以先看結論。

結論:在比較兩球員的球場表現時,WS不是一個好標準。

以下是證明過程。

————————————————————————————————————————

1、勝利貢獻值(WS)計算方法

WS=OWS(進攻貢獻值)+DWS(防守貢獻值)

OWS的計算方法:

計算球員得分產出(這裡的得分產出不是得分,但具體定義是什麼,在更專業的書里有,我還沒能力查到);

計算球員進攻回合;

計算球員邊際進攻 公式為:(球員得分產出)-0.92*(聯盟每回合得分)*(球員進攻回合);

計算每場勝利的邊際得分 公式為:0.32*(聯盟場均得分)*[(球隊節奏)/(聯盟節奏)];

計算球員進攻勝利貢獻值OWS 公式為:(球員邊際進攻)/(每場勝利的邊際得分)。

DWS的計算方法:

計算球員防守效率值

計算球員邊際防守 公式為:(球員上場時間/全隊上場時間)*(球隊防守回合)*[1.08*(聯盟每回合得分)-(防守效率值)/100];

計算每場勝利邊際得分 公式同OWS中的計算方法。

計算球員防守勝利貢獻值(DWS) 公式為:(球員邊際防守)/(每場勝利邊際得分

最後,WS=OWS+DWS

————————————————————————————————————————

二、本文所使用的概念名詞的表達方式

上文加粗標註的概念性名詞會在本文的推導過程中經常使用到。為了在公式中表述方便,將每個概念性名詞設定一個英文縮寫,匯總如下:

  • 得分產出:pp (Points Produced)
  • 進攻回合:op (Offensive Possessions)
  • 邊際進攻:mo (Marginal Offense)
  • 每回合得分:ppp( Points Per Possession)
  • 每場勝利邊際的分:MPW (Marginal Points per Win)
  • 聯盟場均得分:ppg (Points Per Game)
  • 節奏:p (Pace)
  • 防守效率值:dr (Defensive Rating)
  • 邊際防守:md (Marginal Defense)
  • 上場時間:t (Time)
  • 防守回合:dp (Defensive Possessions)

其中涉及到球員數據的,用P+小寫字母下標的形式表示;涉及球隊數據的,用大寫字母T表示;涉及聯盟數據的,用大寫字母N表示。

例如,某一名球員的進攻回合數表示方法為: {{P}_{_{op}}}

該球員所在球隊的節奏為: {{T}_{p}}

聯盟的場均得分為: {{N}_{ppg}}

明確了表示方式,以下是證明過程。

————————————————————————————————————————

三、證明過程及原始結論

1、 用英文字母縮寫形式推導出基本表達式

(1)、表示出OWS的計算公式:

OWS=frac{{{P}_{mo}}}{MPW}

對於分子,有:

{{P}_{mo}}={{P}_{pp}}-0.92cdot {{N}_{ppp}}cdot {{P}_{op}}

對於分母,有:

MPW=0.32cdot {{N}_{ppg}}cdot frac{{{T}_{p}}}{{{N}_{p}}}

整理可得:

OWS=frac{{{P}_{mo}}}{MPW}=frac{{{N}_{p}}}{0.32{{N}_{ppg}}{{T}_{p}}}left( {{P}_{pp}}-0.92{{N}_{ppp}}{{P}_{op}} 
ight)

(2)、表示出DWS的計算公式:

DWS=frac{{{P}_{md}}}{MPW}

對於分子,有:

{{P}_{md}}=frac{{{P}_{t}}}{{{T}_{t}}}cdot {{T}_{dp}}cdot 1.08cdot left( {{N}_{ppp}}-frac{{{P}_{dr}}}{100} 
ight)

對於分母,有:

MPW=0.32cdot {{N}_{ppg}}cdot frac{{{T}_{p}}}{{{N}_{p}}} (同上)

整理可得:

DWS=frac{{{P}_{md}}}{MPW}=frac{{{N}_{p}}}{0.32{{N}_{ppg}}{{T}_{p}}}left[ left( frac{1.08{{T}_{dp}}}{{{T}_{t}}} 
ight){{P}_{t}}left( {{N}_{ppg}}-frac{{{P}_{dr}}}{100} 
ight) 
ight]

(3)表示出WS的計算公式:

WS=OWS+DWS

=frac{{{N}_{p}}}{0.32{{N}_{ppg}}{{T}_{p}}}left[ left( frac{1.08{{T}_{dp}}}{{{T}_{t}}} 
ight){{P}_{t}}left( {{N}_{ppg}}-frac{{{P}_{dr}}}{100} 
ight)+{{P}_{pp}}-0.92{{N}_{ppp}}{{P}_{op}} 
ight]

2、 變數替換、化簡

在對比兩個球員的WS值時,有關聯盟的數據對雙方的影響都是相同的,視為常數項,因此將 {{N}_{p}}{{N}_{ppp}}{{N}_{ppg}} 這樣的項替換為 abc ,等式變為:

frac{a}{0.32b{{T}_{p}}}left[ left( frac{1.08{{T}_{dp}}}{{{T}_{t}}} 
ight){{P}_{t}}left( b-frac{{{P}_{dr}}}{100} 
ight)+left( {{P}_{pp}}-0.92c{{P}_{op}} 
ight) 
ight]

把每個因式中所有包含球隊數據變數的項,設為 {{g}_{i}}left( {{x}_{j}} 
ight)

把每個因式中所有包含球員數據變數的項,設為 {{f}_{i}}left( {{y}_{j}} 
ight)

注意:此處括弧內的 {{x}_{j}}, {{y}_{j}} 可能代表不止一個變數!

例如,令

frac{a}{0.32b{{T}_{p}}}={{g}_{1}}({{x}_{1}})  frac{1.08{{T}_{dp}}}{{{T}_{t}}}={{g}_{2}}({{x}_{2}})

{{P}_{t}}left( b-frac{{{P}_{dr}}}{100} 
ight)={{f}_{1}}({{y}_{1}}) {{P}_{pp}}-0.92ccdot {{P}_{op}}={{f}_{2}}({{y}_{2}})

等式的最終形式變為:

WS={{g}_{1}}left( {{x}_{1}} 
ight)left[ {{g}_{2}}left( {{x}_{2}} 
ight){{f}_{1}}left( {{y}_{1}} 
ight)+{{f}_{2}}left( {{y}_{2}} 
ight) 
ight]

={{g}_{1}}({{x}_{1}}){{g}_{2}}({{x}_{2}}){{f}_{1}}({{y}_{1}})+{{g}_{1}}({{x}_{1}}){{f}_{2}}({{y}_{2}})(*)

3、 通過一個簡單的小問題來引出結論

沒有看完或看懂全部證明過程的朋友,看到上面的式子,也能大概理解本證明過程的基本思想,那就是:WS值的得出,是由球隊表現與球員表現共同決定的。

現在再來看最終結論的 (*) 式。

再次強調: {{g}_{i}}({{x}_{j}}) 項是描述球隊表現的, {{f}_{i}}({{y}_{j}}) 項是描述球員表現的。

設杜蘭特的WS值為 K{{D}_{ws}}({{x}_{i}},{{y}_{j}}) ,詹姆斯的WS值為 LB{{J}_{ws}}({{x}_{i}},{{y}_{j}})

則有 K{{D}_{ws}}({{x}_{i}},{{y}_{j}})={{g}_{1}}({{x}_{1}}){{g}_{2}}({{x}_{2}}){{f}_{1}}({{y}_{1}})+{{g}_{1}}({{x}_{1}}){{f}_{2}}({{y}_{2}})

LB{{J}_{ws}}({{x}_{i}},{{y}_{j}})={{g}_{1}}({{x}_{3}}){{g}_{2}}({{x}_{4}}){{f}_{1}}({{y}_{3}})+{{g}_{1}}({{x}_{3}}){{f}_{2}}({{y}_{4}})

試問:若有 {{f}_{1}}({{y}_{3}})>{{f}_{1}}({{y}_{1}}) {{f}_{2}}({{y}_{4}})>{{f}_{2}}({{y}_{2}})

是否存在 {{g}_{i}}({{x}_{j}}) ,使得 K{{D}_{ws}}({{x}_{i}},{{y}_{j}})>LB{{J}_{ws}}({{x}_{i}},{{y}_{j}})

(實際意義翻譯:當詹姆斯的個人表現數據全面優於杜蘭特的個人表現數據時,是否存在騎士的球隊數據遜於勇士的球隊數據,使得詹姆斯的WS值低於杜蘭特的WS值的情況?)

我想不需要我證明了,一定是存在的。

所以,當一名球員表現優於另一名球員的表現時,並不能確定這二者的WS值高低。

因此:WS值不是用來衡量球員球場表現的良好數據。

證明完畢。

————————————————————————————————————————

四、結論、推論,及部分反駁

1、結論與推論

為什麼說在對比兩名球員的個人表現時,WS不是個好的比較標準呢?我們回到第三部分的 (*) 式: WS={{g}_{1}}({{x}_{1}}){{g}_{2}}({{x}_{2}}){{f}_{1}}({{y}_{1}})+{{g}_{1}}({{x}_{1}}){{f}_{2}}({{y}_{2}})

從初中學物理和化學開始,我們就接觸到了一個比較兩者在某方面產生不同作用時,需要用到的一個基本思想——控制變數法。

很顯然,在對比兩名球員的個人表現時,WS值含有無法控制的變數,因此比不出兩個不同球隊球員的賽場表現。

當然,如果兩個球員是同隊球員,那麼涉及球隊表現的變數就可以控制,這樣就可以比較出兩名隊員個人表現的高低。所以,WS值只適用於隊內球員分蛋糕,不適用於不同隊球員的比武。

不過可能還有朋友有疑問,既然如此,每年給出WS值排名的意義何在?為什麼每賽季WS值最高的球員大概率成了MVP,累計的歷史WS值排名又有什麼意義?

我們還是回到第三部分的 (*) 式: WS={{g}_{1}}({{x}_{1}}){{g}_{2}}({{x}_{2}}){{f}_{1}}({{y}_{1}})+{{g}_{1}}({{x}_{1}}){{f}_{2}}({{y}_{2}})

我們發現,雖然個人表現好,個人WS值不一定高;球隊表現好,個人WS值也不一定高,但是如果球隊表現和個人表現都很好,WS值很高,是確定無疑的。

這也是為什麼WS值最高的球員與MVP獲得者重合率比較高的原因——因為他們的尋找結果都是:最好球隊的最好球員。

以及,對於歷史累計WS的意義,這個數據高,則可以表明:該球員在其職業生涯中一直表現出色,在球隊中佔有重要地位,且該球員所在的球隊在長時間內都很有競爭力。因此也並不是一項無意義的統計數據。

2、對數據哥一些言論的反駁

反駁的觀點發表在數據哥的一篇回答中。還好,沒有被刪除。

zhihu.com/question/6262

其中提到了幾點:

很顯然,根據我們在上面已經得出的WS計算公式的最終形式,可以很輕易地看出數據哥在這裡的錯誤:

  • 個人WS值,也是與團隊數據掛鉤的量;
  • WS值不能被理解為「產出勝場」,因為這樣就有種這些勝場是由這些球員「獨立」創造出來的意思。而實際上來看,球員WS值受球隊數據影響很大,而不同球隊有不同的球隊數據,如果說一個球員換一支球隊而影響了他的某種個人能力,顯然是說不過去的。
  • 既然兩名球員的個人WS數據的高低比不出兩人的個人能力強弱,那所有人的WS加起來做對比也並沒有什麼意義。而且根據我們上面得到的表達式也可以看出來,用杜蘭特的個人數據與騎士隊的球隊數據做運算,得出的數值不具有現實意義。

全部正文內容結束。

數據哥之前也發了一篇挑戰帖,我在此效仿一下,歡迎數據哥的發言人,以及他的粉絲們,在評論區提問。

=============================================

以下是部分篩選評論問答內容

感謝@垚紫光在評論區提出的很有含金量的問題

你的問題1 可以參看 basketball-reference.com,裡面對於Pace有比較詳細的定義和計算公式。

我們可以得到,在同一場比賽里,兩個球隊的節奏是相同的。

問題2 我還沒有找到具體的Defensive Possessions的定義,是我的失誤。不過可以參看上述鏈接的關於Possession的定義,或許可以自己推出結論。由於我對我的定義不太確定因此不發表了,但有一點應該是確定的:即使是同一場比賽,兩隊的防守回合數也不相同。如果您找到了標準定義,歡迎告知。

由於我們從公式中得出,球隊數據方面主要從Tp、Tdp和Tt上存在差異,而對於總決賽,兩隊節奏是相同的,上場時間也相同,所以球員的數據僅取決於Tdp——球隊防守回合數?這麼一個球隊數據項?

實際上,在這個公式中還有一個不太嚴謹的定義——Ppp,球員得分產出。之前在定義中提到,這個得分產出並不是球員的得分,實際上,它的計算公式中也包含很多球隊數據的項。但是要分離這個數據中包含的球隊數據項和球員數據項,步驟十分繁瑣,且會讓整個WS值的表達公式顯得過於複雜,不易理解。對於有興趣了解的朋友,我在此展示一下這個數據中包含了哪些基礎數據。

以上內容來自basketball-reference.com

Points Produced概念提出來自於Dean Oliver的著作「Basketball on Paper」

本質上不影響本文的主要思想——WS值是和球隊表現和球員表現雙重掛鉤的一個數據,不能用來簡單粗暴的比較兩名球員的球場表現。

以及,數據哥的RWS計算方法,只是對WS原始值的線性放縮,並沒有改變雙重掛鉤的本質。

再次感謝@垚紫光這位朋友提出的如此具有啟發性的問題。
推薦閱讀:

如何看待騎士奪冠詹姆斯跪地哭成淚人的表現?
詹姆斯和科比你喜歡誰?
詹姆斯到底有多好?
如果詹姆斯在波波維奇手下打球會是什麼樣子?
如何評價 2016-2017 賽季 NBA 東部決賽騎士 vs. 凱爾特人 G3?

TAG:NBA | NBA季后赛 | 勒布朗·詹姆斯LeBronJames |