NBA賽事分析
數據介紹
NBA2011-2012季後賽球員數據統計
可視化分析前的思考
這次是我在校上課的一次實踐作業,共有三份數據,一份是巴西世界盃的小組賽數據、一份是中國教育水平發展指標歷史數據報告,還有一份就是這份報告,因為我之前做過巴西世界盃的數據,所以這次就在剩下的兩個數據選擇,考慮了一下,NBA這個數據維度變數較少,度量值大都類似,而中國教育的那個應該會更好做一些。所以我還是選擇了NBA的這個數據。<-_->
既然可挖掘的維度較少,我就考慮向挖掘一下數據的深度,通過建立不同的計算欄位,挖掘更多的隱藏信息。
一、球員基本情況介紹
儀錶板——基本情況
球員的各項評分
按球隊與球員細分的球員編號, 三分命中率, 兩雙, 先發, 出場, 分鐘, 助攻, 命中率, 失誤, 得分, 搶斷, 效率, 犯規, 蓋帽, 籃板, 罰球命中率, 進攻和防守,類似於Excel中的表格。
球隊三分命中位置分布情況
分層結構查看每支球隊和球員的三分球命中率。
比較有意思的一項是——三分命中率較高的球員大部為前鋒或是後衛,羅伊-希伯特大概是個例外。
命中率情況
分層結構,展示的是球隊總體命中率的趨勢。圖中區域上下限分別為平均值的80%和110%。
馬刺球隊果然很強,從這張圖可以看出整體水平的差異性。
二、效率指標評價
儀錶板——效率指標評價
效率值檢查
看到這個指標的第一眼是去查看了專業評價指標效率的定義:
NBA球員效率指數公式為:[(得分+籃板+助攻+搶斷+封蓋)-(出手次數-命中次數)-(罰球次數-罰球命中次數)-失誤次數]/球員上場比賽的場次。這個依據的得出,可以綜合判斷球員良性表現,並且參照球員的球場不良表現,接著根據球員出場的次數來得出單場平均的效率表現。故建立新的計算欄位——效率指數,根據效率計算公式,發現兩者的值非常相近。即在數據的可視化過程中驗證了數據的真實性。
進攻和防守與效率值的比較
新建計算欄位——進攻和防守欄位("[防守]-[進攻]"),為什麼想要這樣建立指標呢?主要考慮到單一的進攻和防守指數都不能全面的說明一支隊伍的強弱,故建立兩者差值,並和隊伍的整體效率值進行比較,整體上來看,兩個隨機變數並沒有很好的溫和在一起,不妨看看效率的均值。
效率和得分的情況
這個關係也是在不斷的嘗試下才發現的兩者的關係,隊伍得分和隊伍效率整體呈現正相關趨勢。
三、得分與進攻形勢分析
儀錶板——得分及進攻形勢分析
每分鐘得分率
考慮到有的球員出場時間並不多,如果單純地看每場比賽的得分情況來對球員進行評價或許有失偏頗,因此建立新的計算欄位——每分鐘得分率,計算欄位的公式為"[得分]/[分鐘]",按照降序排列之後,科比、詹姆斯、諾維斯基排名前三。
製作瀑布圖展示隊伍的進攻性,條形圖的長度越長,代表進攻性越強。可以看到——排在前三的隊伍分別是爵士、掘金、湖人。
得分和犯規以及助攻情況
製作倒金字塔,展示球隊或是球員得分情況和助攻以及犯規情況的對比。
得分越低、助攻越少我能理解,但是得分越低犯規次數也相應的有降低的趨勢是怎麼一回事呢?
四、包裝成一個故事
每學期的這幾周總是特別忙,趁這次作業再補上一篇文章吧,這一次的文章里中我有提到怎麼去建立一個計算欄位的思路,大家可以參考一下,雖然都是一些很簡單的欄位,hhh。
前一段時間在網上看到了一個關於tableau的高級圖匯總,鏈接在這裡(Tableau高級可視化圖表:帕累托圖、金字塔圖(蝴蝶圖)、盒須圖、瀑布圖、範圍-線圖、桑基圖等(未完待續))但是這個文章裡面沒有關於這些圖是怎麼做的,等到考完結課考試,我把這些圖一個個地都做一遍,不一定非要使用它給的這些教程的數據,因為我覺得我們在學習的過程中學會這些方法才更加重要。
另外、我把本次的twbx文件上傳到百度網盤了(鏈接:https://pan.baidu.com/s/1o8Sjd4A 密碼:i59c)
推薦閱讀:
※Python 數據分析學習路線
※數據分析師入門
※數據分析,讓你成為人群中的1%
※皇帝與太子,不,前太子
※一些關於TI7隊伍的數據分析——Liquid篇