為什麼WS值不能用來衡量兩名球員的表現好壞?
之前就說過,要正面剛一剛@數據Simon的那套WS來衡量球員能力和歷史地位的理論。現在把反駁的一些觀點整理成比較系統的內容,獻給所有看客,就當瞧個熱鬧。
鑒於數據哥已經被封號了,所以在此拜託曾經被數據哥委託傳聲的 @MichaelChan 、 @kobezhaojing 以及在https://www.zhihu.com/question/63385381 問題下也發布了數據哥的聲明的某位匿名的朋友,歡迎你們幫數據哥傳達對於我文章里所表達觀點的意見。
以及在上述提問下面發布過回答的 @雨中聽雪 、 @awpwyx 、 @哥舒夜 、 @秒速五厘米 、 @日月星峰 、 @EDCBA 等其他說「詹密們辯理辯不過就在這兒耍舉報的陰招」的朋友,先聲明幾句話:
- 詹密少,且正面懟數據哥的人的回答,很容易被一些極端粉絲給踩下去,你們看不到;
- 理論錯誤需要系統性的理論解釋來批駁,這個功夫不是誰都有的。 @一方總隊長 在自己的回答中曾經很系統地指出過數據哥的錯誤,而數據哥的回應很明顯是顧左右而言他,這其實是心虛的表現。
- 你們說詹密聯合舉報就被封號,空口無憑。數據哥說個什麼結論還會找找實例來支持。建議你們的知乎勇密群,集體去舉報一個正常回答,看看會不會把別人的號封了,如果真的封了,你們不是更找到了一個為數據哥申訴同時狀告詹密的鐵證么?
正文開始
=============================================
0、前言
關於WS的定義和計算方法,BBR上給出了定義,這是許多籃球數據愛好者,包括數據Simon都會經常使用的一個網站。
https://www.basketball-reference.com/about/ws.html
嫌看英語麻煩的朋友,可以參考天涯的一篇帖子,是中文翻譯版。
怎樣計算球員進攻勝利貢獻值_籃球公園_天涯論壇_天涯社區
我在這裡也會給出中文的計算過程。
證明過程略長,耐心稍差的朋友,或者對數學運算看不懂或沒興趣的朋友,可以先看結論。
結論:在比較兩球員的球場表現時,WS不是一個好標準。
以下是證明過程。
————————————————————————————————————————
1、勝利貢獻值(WS)計算方法
WS=OWS(進攻貢獻值)+DWS(防守貢獻值)
OWS的計算方法:
計算球員得分產出(這裡的得分產出不是得分,但具體定義是什麼,在更專業的書里有,我還沒能力查到);
計算球員進攻回合;計算球員邊際進攻 公式為:(球員得分產出)-0.92*(聯盟每回合得分)*(球員進攻回合);計算每場勝利的邊際得分 公式為:0.32*(聯盟場均得分)*[(球隊節奏)/(聯盟節奏)];計算球員進攻勝利貢獻值OWS 公式為:(球員邊際進攻)/(每場勝利的邊際得分)。DWS的計算方法:計算球員防守效率值;計算球員邊際防守 公式為:(球員上場時間/全隊上場時間)*(球隊防守回合)*[1.08*(聯盟每回合得分)-(防守效率值)/100];計算每場勝利邊際得分 公式同OWS中的計算方法。計算球員防守勝利貢獻值(DWS) 公式為:(球員邊際防守)/(每場勝利邊際得分)
最後,WS=OWS+DWS
————————————————————————————————————————
二、本文所使用的概念名詞的表達方式
上文加粗標註的概念性名詞會在本文的推導過程中經常使用到。為了在公式中表述方便,將每個概念性名詞設定一個英文縮寫,匯總如下:
- 得分產出:pp (Points Produced)
- 進攻回合:op (Offensive Possessions)
- 邊際進攻:mo (Marginal Offense)
- 每回合得分:ppp( Points Per Possession)
- 每場勝利邊際的分:MPW (Marginal Points per Win)
- 聯盟場均得分:ppg (Points Per Game)
- 節奏:p (Pace)
- 防守效率值:dr (Defensive Rating)
- 邊際防守:md (Marginal Defense)
- 上場時間:t (Time)
- 防守回合:dp (Defensive Possessions)
其中涉及到球員數據的,用P+小寫字母下標的形式表示;涉及球隊數據的,用大寫字母T表示;涉及聯盟數據的,用大寫字母N表示。
例如,某一名球員的進攻回合數表示方法為: ;
該球員所在球隊的節奏為: ;
聯盟的場均得分為:
明確了表示方式,以下是證明過程。
————————————————————————————————————————
三、證明過程及原始結論
1、 用英文字母縮寫形式推導出基本表達式
(1)、表示出OWS的計算公式:
,
對於分子,有:
對於分母,有:
整理可得:
(2)、表示出DWS的計算公式:
對於分子,有:
對於分母,有:
(同上)
整理可得:
(3)表示出WS的計算公式:
2、 變數替換、化簡
在對比兩個球員的WS值時,有關聯盟的數據對雙方的影響都是相同的,視為常數項,因此將 、 、 這樣的項替換為 、 、 ,等式變為:
把每個因式中所有包含球隊數據變數的項,設為 ;
把每個因式中所有包含球員數據變數的項,設為 ;
注意:此處括弧內的 , 可能代表不止一個變數!
例如,令
, ,
, ,
等式的最終形式變為:
3、 通過一個簡單的小問題來引出結論
沒有看完或看懂全部證明過程的朋友,看到上面的式子,也能大概理解本證明過程的基本思想,那就是:WS值的得出,是由球隊表現與球員表現共同決定的。
現在再來看最終結論的 式。
再次強調: 項是描述球隊表現的, 項是描述球員表現的。
設杜蘭特的WS值為 ,詹姆斯的WS值為 ,
則有
試問:若有 , ,
是否存在 ,使得 ?
(實際意義翻譯:當詹姆斯的個人表現數據全面優於杜蘭特的個人表現數據時,是否存在騎士的球隊數據遜於勇士的球隊數據,使得詹姆斯的WS值低於杜蘭特的WS值的情況?)
我想不需要我證明了,一定是存在的。
所以,當一名球員表現優於另一名球員的表現時,並不能確定這二者的WS值高低。
因此:WS值不是用來衡量球員球場表現的良好數據。
證明完畢。
————————————————————————————————————————
四、結論、推論,及部分反駁
1、結論與推論
為什麼說在對比兩名球員的個人表現時,WS不是個好的比較標準呢?我們回到第三部分的 式:
從初中學物理和化學開始,我們就接觸到了一個比較兩者在某方面產生不同作用時,需要用到的一個基本思想——控制變數法。
很顯然,在對比兩名球員的個人表現時,WS值含有無法控制的變數,因此比不出兩個不同球隊球員的賽場表現。
當然,如果兩個球員是同隊球員,那麼涉及球隊表現的變數就可以控制,這樣就可以比較出兩名隊員個人表現的高低。所以,WS值只適用於隊內球員分蛋糕,不適用於不同隊球員的比武。
不過可能還有朋友有疑問,既然如此,每年給出WS值排名的意義何在?為什麼每賽季WS值最高的球員大概率成了MVP,累計的歷史WS值排名又有什麼意義?
我們還是回到第三部分的 式: 。
我們發現,雖然個人表現好,個人WS值不一定高;球隊表現好,個人WS值也不一定高,但是如果球隊表現和個人表現都很好,WS值很高,是確定無疑的。
這也是為什麼WS值最高的球員與MVP獲得者重合率比較高的原因——因為他們的尋找結果都是:最好球隊的最好球員。
以及,對於歷史累計WS的意義,這個數據高,則可以表明:該球員在其職業生涯中一直表現出色,在球隊中佔有重要地位,且該球員所在的球隊在長時間內都很有競爭力。因此也並不是一項無意義的統計數據。
2、對數據哥一些言論的反駁
反駁的觀點發表在數據哥的一篇回答中。還好,沒有被刪除。
https://www.zhihu.com/question/62627750/answer/200406532
其中提到了幾點:
很顯然,根據我們在上面已經得出的WS計算公式的最終形式,可以很輕易地看出數據哥在這裡的錯誤:
- 個人WS值,也是與團隊數據掛鉤的量;
- WS值不能被理解為「產出勝場」,因為這樣就有種這些勝場是由這些球員「獨立」創造出來的意思。而實際上來看,球員WS值受球隊數據影響很大,而不同球隊有不同的球隊數據,如果說一個球員換一支球隊而影響了他的某種個人能力,顯然是說不過去的。
- 既然兩名球員的個人WS數據的高低比不出兩人的個人能力強弱,那所有人的WS加起來做對比也並沒有什麼意義。而且根據我們上面得到的表達式也可以看出來,用杜蘭特的個人數據與騎士隊的球隊數據做運算,得出的數值不具有現實意義。
全部正文內容結束。
數據哥之前也發了一篇挑戰帖,我在此效仿一下,歡迎數據哥的發言人,以及他的粉絲們,在評論區提問。
=============================================
以下是部分篩選評論問答內容
感謝@垚紫光在評論區提出的很有含金量的問題
你的問題1 可以參看 https://www.basketball-reference.com/about/glossary.html,裡面對於Pace有比較詳細的定義和計算公式。
我們可以得到,在同一場比賽里,兩個球隊的節奏是相同的。
問題2 我還沒有找到具體的Defensive Possessions的定義,是我的失誤。不過可以參看上述鏈接的關於Possession的定義,或許可以自己推出結論。由於我對我的定義不太確定因此不發表了,但有一點應該是確定的:即使是同一場比賽,兩隊的防守回合數也不相同。如果您找到了標準定義,歡迎告知。
由於我們從公式中得出,球隊數據方面主要從Tp、Tdp和Tt上存在差異,而對於總決賽,兩隊節奏是相同的,上場時間也相同,所以球員的數據僅取決於Tdp——球隊防守回合數?這麼一個球隊數據項?
實際上,在這個公式中還有一個不太嚴謹的定義——Ppp,球員得分產出。之前在定義中提到,這個得分產出並不是球員的得分,實際上,它的計算公式中也包含很多球隊數據的項。但是要分離這個數據中包含的球隊數據項和球員數據項,步驟十分繁瑣,且會讓整個WS值的表達公式顯得過於複雜,不易理解。對於有興趣了解的朋友,我在此展示一下這個數據中包含了哪些基礎數據。
以上內容來自https://www.basketball-reference.com/about/ratings.htmlPoints Produced概念提出來自於Dean Oliver的著作「Basketball on Paper」本質上不影響本文的主要思想——WS值是和球隊表現和球員表現雙重掛鉤的一個數據,不能用來簡單粗暴的比較兩名球員的球場表現。以及,數據哥的RWS計算方法,只是對WS原始值的線性放縮,並沒有改變雙重掛鉤的本質。再次感謝@垚紫光這位朋友提出的如此具有啟發性的問題。推薦閱讀:
※如何看待騎士奪冠詹姆斯跪地哭成淚人的表現?
※詹姆斯和科比你喜歡誰?
※詹姆斯到底有多好?
※如果詹姆斯在波波維奇手下打球會是什麼樣子?
※如何評價 2016-2017 賽季 NBA 東部決賽騎士 vs. 凱爾特人 G3?
TAG:NBA | NBA季后赛 | 勒布朗·詹姆斯LeBronJames |