標籤:

【NBA大數據】陣容均衡之全民皆兵還是巨頭獨專?勇馬逼不得已,船鹿完成蛻變

數據是真實球場的快照與現實採樣。基礎面板數據直觀易懂是球場數據的第一面,高階數據及基礎面板數據的描述性統計分析是第二面,與數據之中發現新的特徵並於球場檢驗辨偽是第三面。

球場上的數據統計分析並不凌駕或者獨立於其他領域。借鑒經濟學、物理學等常見統計指標與方法,應用於籃球場,是球場數據第三面的基本方法之一。比如通信系統中的熵用以表示信源的不確定性,同樣可以用於球場分析陣容的打法規律;比如,球員的傳球、投籃、運球的不確定時間序列可以視為隱馬爾科夫鏈,這是語音識別的基本核心原理。(這bi裝的過癮啊)

再比如,Nylon Caculus專欄作者Todd Whitehead(老牌作者),Sebastian Pycior(社會學家)都曾用過赫芬達爾-赫希曼指數HHI,衡量球隊的陣容均衡度。那麼,HHI這個是什麼鬼東西呦,和HCG有啥區別,怎麼衡量球隊陣容呢

HHI指數,是一種測量產業集中度的綜合指數,它是指一個行業中各市場競爭主體所佔行業總收入或總資產百分比的平方和,用來計量市場份額的變化,即市場中廠商規模的離散度或者壟斷度。類比到球場,應用於計算得分、助攻、上場時間等數據的HHI,就得到了每個隊這些數據的「壟斷程度」,是萬箭齊發的全民皆兵,還是一馬當先的寡頭獨專,一目了然矣

球隊數據壟斷

回顧17-18賽季,計算各球隊每一場的得分與助攻的HHI Index(Nylon Caculus是直接用賽季整體平均數據計算,顯然不合理),並取平均值,結果如下

明顯的四個群集也相應表徵了不同球隊的作戰風格,當然了,非絕對的

類型Ⅰ:全民皆兵,或者說尚未確定一錘定音的團隊核心

類型Ⅱ:有球星,有深度,相對隊友來說,球星的數據並不拔尖

類型Ⅲ:有頂尖球星一肩獨挑球隊進攻大梁(利拉德、濃眉、字母哥)

類型Ⅳ:有超級球星(威少、燈泡),並且數據超級爆炸

去年的幾個季後賽球隊風格也不盡相同,馬刺爵士等是全民皆兵的典範;勇士因由四巨頭數據平攤陣容彰顯均衡;騎士老詹一人發力帶動隊友;開拓者、雄鹿、濃眉孤軍將帥力戰而不捷;火箭、雷霆超級寡頭雄視天下。那麼,18-19賽季至今,HHI又有何變化咧?見下圖

不改去年風格,休城臀將軍彎弓射鵰繼續引領天下,超級寡頭繼續當道;勇士庫湯杜場均皆20分以上,但後續攻擊不足斷崖式下跌,球隊第四得分格林場均只有6.x分,因此PTS HHI高居聯盟第一;費城、汽車城已經邁入有球星攻堅獨挑大樑的時代了;雄鹿、開拓者、雷霆、猛龍深度更厚了;湖人、騎士終於完美互換位置了

個人數據

我想各個球隊的數據壟斷巨頭,大傢伙都清楚,但是壟斷程度放在整個聯盟大概是個什麼水平呢?先看過去一個賽季的,如下,瞭然!各球隊的老大們躍然紙上。威少、哈登、勒布朗、利拉德顯然的聯盟四大數據巨頭

那麼18-19賽季,這些球隊寡頭是否仍然寡著呢?再看下圖,由於出場的不足,威少的位置暫時不夠突出;哈登得分壟斷、洛瑞助攻亦然;恩比德、拉文、庫里也分別肩負著球隊的得分重任;字母哥利拉德濃眉,你不仔細都很難找到他們的位置了

出場時間

同樣,把HHI應用於各球員的出場時間,那些狠操球員的瘋狂教練應該會露出水面啦。為了便於查看,下表HHI縮小了百倍,並且對比了新舊賽季的HHI。

上賽季森林狼MINS HHI高居第一,奪冠的勇士接近末端。新賽季咧?水深火熱的休斯敦,戰績刻不容緩迫在眉睫,狠操球星那是逼不得已的事情,而森林狼由於教練的風格狠操值高居第二那是正常發揮

雄鹿、快船、開拓者、掘金,相比上賽季,這賽季的他們,有更多人打球了,有更多人分擔球場上的任務了,你不得不讚歎他們的巨大蛻變。而另一端的馬刺不同往日,GDP已成歷史,諸葛波波軍中無將可用,狠操球星那也是不得已之下策

下表MINS HHI,代表出場時間集中度,值越高,說明球隊中出場時間越集中在某些人身上,簡單來說,就是狠操球星,比如典型的錫伯杜打法。

現在你知道了HHI Index,也知道了如何應用之分析球隊的陣容均衡,那麼請大膽想像HHI Index用於對比常規賽與季後賽的結果吧

最後,一個問題:巨頭們數據超級暴漲了,但把球隊帶到更高層次卻更困難了,那麼究竟是群雄並起的全民皆兵更勝一籌,還是巨頭獨專的一挽狂瀾棋高一著呢

Nylon Caculus的HHI分析請移步 以下鏈接查看

fansided.com/2018/08/22


jumpshot致力於NBA可視化與數據分析,數據非常有意思,體育數據的積累及專業的數據分析在當下的大數據時代非常有必要,國外有大量從事體育數據分析的專業及業餘人士,這也越發顯得國內此塊的落後,跳投哥在此希望得到更多的小伙們的關注,也希望有志之士聯繫我一起學習探討!感興趣的掃碼關注吧!

推薦閱讀:

TAG:NBA | 數據分析 |