標籤:

真實命中率到底「真實」在哪?

真實命中率到底「真實」在哪?

來自專欄籃圈即是原點133 人贊了文章

經常有關注我們的朋友私信來問關於一些常見的高階數據的問題,例如它們是如何計算,有哪些優點,又有哪些局限性,如何看待和使用這些數據。在賽季期間,我們一般很難有閑暇來談論這些問題,所以這個休賽期,我們會儘可能的選取一些有趣的切入點,儘可能少的列讓人感到厭煩的公式,讓大家輕鬆的了解這些高階數據的優缺點和使用場景,做一個數據科普系列。

什麼是真實命中率?

真實命中率(True Percentage)是一項衡量出手效率的百分數數據,通常會被簡寫為TS%,本質上也是投籃命中率,但由於籃球比賽每次出手的分值並不是完全相同的,真實命中率針對三分和罰球做了一定的修正。它的計算公式是:

TS% = 100% * PTS / [ 2* ( FGA + 0.44 * FTA ) ]

它的核心思想很簡單,就是把每一次出手都調整成一次兩分出手,體現球員每次出手的得分回報,而我們知道籃球比賽就是比誰的得分多,同時又是一種帶有球權強制交換的回合制遊戲,因此比賽雙方創造得分的機會實質是有限的,如何把握機會成為了取勝的關鍵,真實命中率就是一種體現機會把握率的數據。

為什麼需要引入真實命中率?

著名數據博客NylonCalculus的專欄寫手Justin兩年前曾寫過一篇介紹TS%的文章,其中舉了一個非常合適的例子來說明引入TS%的必要性。04年總冠軍活塞的場上大腦比盧普斯的職業生涯投籃命中率僅有41.5%,甚至有幾個賽季是低於40%的,這其中也包括了他的冠軍賽季(39.5%)。傳統觀點會認為他可能是一支優秀球隊的「問題」,而事實上,比盧普斯的巔峰期每36分鐘出手5次三分已經能排到聯盟前20%,同時他也具備一定的造犯規能力,還是出色的罰球手。因此,在05年Handcheck吹罰更改後,他的真實命中率連續多年維持在精英級的60%以上。球隊的「問題」?不,他是名副其實的冠軍後衛。所以,從這個案例上,我們就能發現,由於不同出手的分值和難度差異,導致投籃命中率無法準確的反映球員把握得分機會的能力,真實命中率是遠比一般的投籃命中率可靠的數據。

為什麼是0.44?

在真實命中率的計算里,我們需要把罰球也換算成一般的出手機會,通常來說,一次投籃犯規可以獲得兩次罰球機會,這意味著,一次罰球佔用了0.5次出手。但是我們必須要考慮加罰,技術犯規罰球,惡意犯規罰球,三罰的第三罰,這些罰球不會額外佔用出手機會,因此實際每次罰球佔用的出手機會小於0.5,大約0.44次。

這裡可能就有朋友想問了,那為什麼要用這個「大約0.44」呢?而不是精確的使用球員真實的回合佔有數。這是個很好的問題,前陣子@靜易墨也問過我類似的問題,在「真正聰明的籃球分析網站」——法爾克的cleaningtheglass上,他有一項名為PSA(Points per Shot Attempt)的數據,即每次出手得分,這個數據本質上就是不採用0.44,而是真實的嘗試出手次數的TS%。靜易墨覺得這個數據比TS%更準確,為什麼不都採用這個數據呢?他說的沒錯,PSA更準確,但之所以TS%被更廣泛採用有兩個原因。

首先,以2017-18賽季為例,我們篩選所有投籃出手次數超過100次的球員,從比賽的play-by-play日誌中提取每一次罰球產生的原因,去除那些諸如加罰,三分罰球的第三罰,技術犯規罰球這些不佔用額外出手次數的罰球,計算出球員罰球佔用的真實出手嘗試次數。這樣,我們就可以得到一個真實真實命中率,也就是PSA(實際PSA是一個百回合數據而不是百分數,這裡為了和TS%比較更方便,也算作百分數),用這個結果和TS%進行比較。

這張圖裡橫軸就是TS%和PSA之間的差值,左側為被TS%低估的,右側為被TS%高估,我們可以看到被TS%高估超過1%的球員僅有1人,而被TS%低估的球員也僅有4人(被低估的球員大部分是執行了大量技術犯規罰球的,有一些分析師認為計算PSA時應該剔除技術犯規罰球的部分,因為獲得這個罰球機會通常不是因為球員的能力),絕大多數球員的誤差都在0.5%以內,可見0.44這個數字是十分準確的。

其次,前面已經提到了,TS%的計算僅僅基於得分罰球和出手數三項基本數據,這三項數據從1946-47賽季,也就是NBA的第一個賽季起就開始被統計了,而我們剛剛計算PSA時所用到的play-by-play比賽日誌,最早也只能追溯到1996-97賽季,也就是說,NBA整整五十個賽季里PSA是無法計算的。再者,即便是最近20個賽季,計算TS%也遠比PSA方便。

所以這就成了一個工程問題,一項需求可以以犧牲極小的性能為代價,大幅度降低工時,同時又能應對更廣泛的工作環境。那麼,為什麼要去提高那麼一丁點的性能呢?

TS%多少算高,多少算低?

一般來說,TS%的聯盟平均水平大約在53%-54%之間,通常低於50%會被認為非常糟糕,大部分都是一些既不能殺入籃下得分或造犯規,也不能投三分,只能在中距離干拔的球員,也就是所謂的不夠「魔球」的球員。而高於60%則會被認為是這一項上的精英球員。TS%高的球員一般是終結型內線,善於突破造犯規的持球手或是高產高效的三分手。

從今年的整體(賽季出手超過300次的球員)分布情況來看,大多數球員的TS%集中在52%到58%之間,今年TS%最高的球員是庫里(67.5%),而只有兩位球員的TS%低於45%,分別是44.4%的鮑爾和43.7%的尼利基納。

不過,TS%水平的高低有時候不得不結合時代來看,80年代以後的大部分時期,TS%都穩定在53%到54%之間,但在20世紀末,21世紀初的幾年裡,由於規則和打法的雙重作用,可以說是聯盟歷史上最黑暗的幾年,進攻成功率非常低。聯盟平均TS%遠低於其他賽季。因此,如果涉及到跨賽季比較,又正好與那幾個賽季有關,應當考慮用「相對聯盟平均TS%」來進行比較。

如何拆解分析TS%

具體的拆解分析TS%會涉及到很多方面的因素,需要具體問題具體分析,這裡很難籠統的給個定論,但大致可以從兩個方向來考慮。

首先,應當明確一個產量和效率之間的關係,TS%是每次出手的得分回報,也就是所謂的效率,而能代表產量的數據也很多,這裡我們採用與TS%大致對應的數據USG%,USG%是球員在場時投籃出手,罰球,失誤所造成的本方進攻回合結束的次數占本方總進攻回合次數的比例,一般翻譯成的使用率,但從含義來說更好的翻譯是回合佔有率。通常來說,產量越高,也就是所謂的承擔任務越重,效率就會越低。這一點國內球迷兩年前都還很少有人意識到,今年開始有大量的自媒體寫手也開始用下面這樣的圖來解釋這一點。

所以,我們在看TS%時往往需要綜合球員的回合佔有率來看,比如同樣處於高TS%的球員,庫里,杜蘭特的高效和小喬丹,科沃爾的高效顯然是有不同意義的,同樣是高效的情況下啊,高產的更有意義。同理,我們雖然看到威少的TS%略低於平均水平,但他扛起了大量的球權,開發出了進攻機會,所以稍低的效率並不意味著他比那些中產中效球員差。不過,有一些傾向於中距離打法的球員並不太容易因為承擔球權的多少而引起TS%的浮動。

其次,我們應當去拆分TS%的組成和球員具體的投籃分布。拆分組成很好理解,TS%的構成里包含了三分和罰球這兩項,可以通過看球員的三分出手比例3PAr和罰球率來FTr來判斷。比如科沃爾的3PAr高達0.777,即77.7%的出手來自三分線外,所以科沃爾TS%高的來源主要是大量的三分出手。再比如德羅贊,他中距離的打法本來是非常低效的,但他還能維持中等水平的效率,這得益於他較強的造犯規能力,連續五年每36分鐘罰球超過7次。

觀察球員的具體投籃分布也是了解球員TS%成因的重要部分,比如蘭斯-史蒂芬森,他三分線外的出手不算多,命中率較差,籃下出手也不多,多數投籃集中在中距離,所以他的TS%較低就完全符合一般的理論,所謂的打法不夠魔球,與他相反的哈登就不必說了,三分,籃下,罰球,該有的一項不少。再比如戈貝爾,小喬丹等人,他們有極高比例的籃下終結出手,TS%高也在情理之中。有一些球員則是特殊情況,比如鮑爾:

球哥的投籃分布已經非常魔球化了,51%的出手來自三分線外,超過同位置83%的球員,31%的出手來自籃下,超過同位置55%的球員。所以他的TS%低的令人髮指,原因就只是真的太鐵了。

我們在這裡只是簡單的講幾個例子,更具體更深入的拆解分析還需要結合更多數據和比賽場景來解讀,這裡的兩點僅作為一個大致的思考方向。

TS%有什麼缺陷么?

一般來說,大家總會去談論某個數據的缺陷,說一些諸如「XX數據偏向於某類球員」這樣的話,很多時候這是對的。但如果在TS%這個問題上說「TS%偏向於那些三分多罰球多的球員」是不合理的,因為在其他說這類話的情形中往往意味著數據的設計缺陷導致了數據對某類球員的高估或是低估。但TS%並不是評估什麼,它只是客觀的記錄球員的每次出手能得到多少的分數回報。三分多罰球多的球員在TS%上顯得好看是因為他們確實比其他球員有更高的得分回報。

另一種更科學的質疑是,罰球相比一般的投籃出手更難獲得前場籃板,三分相比中近距離的出手也更難獲得前場籃板,因此TS%並不能像它的公式展示的一樣等效於每次出手的回報。對於這個問題,我和NylonCalculus的專欄寫手Justin的觀點一樣,這本來就不是TS%應該承擔的任務,這是一個籃板問題。我們本來就不應該指望一個關於投籃效率的數據能夠回答球場上的所有問題。

因此,我傾向於認為在TS%合理的應用範圍內它並沒有致命缺陷,它是一個非常可靠的數據。


還想了解更多關於數據的問題,該怎麼辦?

當然是關注「籃圈即是原點」啊(沒錯,這就是廣告)微博和微信公眾號都是這個名字。


推薦閱讀:

快樂垂釣頻道系列賽事報名費全免
為什麼張佳瑋在虎撲只發帖不回帖?
充滿爭議的高階數據——PER值之風雲再起!
比賽日:火箭還有機會嗎?

TAG:NBA |