OPTA 發布的球員在每場比賽中的熱點圖和傳球線路是怎樣製作出來的?

前段時間看到知乎上有答主說OPTA的很多數據是靠人工守在電視機前數出來的,那麼那些熱點圖和球員的傳球線路圖又是基於怎樣的統計結果得出並製作出的?


先說熱點圖:把球場看成一個平面直角坐標系,以一定頻率(1Hz 足矣,保險起見 20Hz)採樣球員的當前位置即可。歐洲主要的 data suppliers,如 OPTA、Prozone(現在是 STATS 旗下公司了)、DeltaTre 等等都是這麼做的。他們具體誰干臟活累活(親自到場邊採集),誰不幹只買,我並不是特別清楚,然而不管誰去干,思路就是這樣的。

上圖擺出來,傳球線路圖也就不用多說了吧!

至於如何採樣人球位置,各公司的各套解決方案各有不同。不過,熱點圖也好,傳球線路也好,基礎統計、高級統計也好,歸根結底,都是要解決兩個根本問題:
1. 人在哪?球在哪?
2. 人球之間、人人之間發生了什麼?

附加的一些問題就是把事件流記錄下來、存儲起來、傳輸出去等等,在此不贅述。

先說第一個。這個問題,目前頂級賽事的主流解決方案,是在球場上方安裝若干個熱成像攝像機/高速攝像機進行 player tracking;

這是老特拉福德安裝的 Vicon SVFT-W23 SurveyorVFT 23x Day/Night Camera Dome SVFT-W23,帶紅外(即熱成像)、夜視,共 8 個,安裝位置如下所示:

如此安裝是為了保證球場每個區域都至少有二個攝像頭覆蓋到。沒錯,博爾頓的銳步球場裝的也是這一套。價格方面 Prozone 早幾年的報價是€170,000,人民幣百萬上下。買好攝像頭安裝好調教好之後,得到的效果就如下面這個視頻所示。注意第 12 秒、第 59 秒、1 分 10 秒:
視頻封面Prozone Sports Ltd - PROZONE3.mpg—在線播放—優酷網,視頻高清在線觀看視頻

(視頻源地址)
所以說有了這玩意之後,熱點圖、傳球線路圖什麼的都還是細枝末節。Performance analysis(像貝大帥一樣分析球員表現)、player recruitment(像教授一樣買球員)什麼的才是重頭。這個偏題太遠,就不多說了。

第二個問題的主流解決方案是雇一幫人盯著屏幕看,俗稱「靠人工守在電視機前數出來的」——但這裡的人並不是一般人,電視機也不是一般電視機。說到這裡我喜歡憑空捏造術語的毛病又犯了...我們可以叫它 CAC,計算機輔助數數/點擊

上面是一張老圖,來自 2011 年每日郵報的一篇文章。可以看到左邊屏幕上界面雖然不夠美觀,但很實用。我不知道這張圖上的這個軟體有沒有連接什麼 player tracking 系統來告訴這個統計員當前屏幕上的兩名球員分別是誰和誰,然而即便它告訴你了,也沒有什麼卵用,不能圖省事直接用演算法的輸出去當作最後的成品。因為演算法不可能做到 100% 準確,還得有人值守在屏幕前,用自己深厚的戰術素養來點擊界面右側的圓圈:嗯,這是英格蘭 3 號阿什利科爾,他將要擲出一個界外球...

這位爺他就發問了:但凡摻進人肉,他就可能出錯啊!沒錯。這擊碎的就是很多不夠資深的球迷對於歐洲足球所謂「高大上」數據統計的迷信。足球數據據我所知目前還沒有能做到「純機器」、「全自動」的收集,OPTA 他們也是「人+機器」,頂多在高科技輔助下效率更高地解決好第一問題(人在哪球在哪),而第二問題(發生了啥)基本還得靠人手。這玩意,一不可能做到百分百準確,二本來也沒什麼唯一客觀準確可言,每家都是在按照自己的理念去收集和解釋數據。所幸大家對於足球當中的種種數據,還是共識居多。有分歧,不影響。

我做過一個小調查,隨便找一場比賽,例如 2014 世界盃決賽德國對阿根廷那場,OPTA 跟 DeltaTre(FIFA 官方合作夥伴)給出的原始數據就有出入,同樣使用 OPTA 數據的幾家「數據解釋商」如 WhoScored、Squawka、Soccerway 等等,彼此之間給出的「解釋」也不盡相同。

上圖:FIFA 官方數據提供商 DeltaTre 的 2014 世界盃決賽部分數據

上圖:數據來源 OPTA,解釋商 Soccerway

上圖:數據來源 OPTA,解釋商 WhoScored

上圖:數據來源 OPTA,解釋商 Squawka

正如我翔/我團名宿、可能是這個星球上最好的科技流體能教練 Valter Di Salvo 所說:「(針對同一場比賽)每家數據提供商拿出的不同數據,背後都是他們自己的一套哲學」。

射門打中門框算 Shot on Target,還是 off Target?每個人都有自己的定義——這不重要。重要的是,去干臟活累活,把數據從場邊收集進信息系統的人,就擁有話語權。

總結一番:不求特別嚴謹的話,第一個問題的解決方案是 player tracking,勉強譯作球員追蹤吧;第二個問題的解決方案是 video coding,勉強譯作&視頻打碼&視頻標記...算了還是不譯為上,中文裡並沒有什麼能夠妥妥與之對應的,還容易產生誤會。

不論熱點圖和傳球線路,現代足球,尤其是頂級賽事/球隊里,絕大部分重要且有意義的統計數據都是用 player tracking 和 video coding 搞出來的。各大公司的產品只是具體實現方面有所區別。


在一個球場上列出x軸和y軸,因此球場上發生的任何動作都有相應的坐標值,在比賽的過程中,數據公司的工作人員會標記每名球員的每個動作,賽後再加以包裝,就很容易得到傳球路線圖。而熱點圖也是根據球員在一場比賽中的觸球位置換算而成。國外的opta是這方面的大牛,國內的話上海創冰做的最好,可能是唯一一家。他們的微信號創冰data發的文章里經常帶有這樣的圖片,也經常在其他文章里看到說數據來源創冰data


推薦閱讀:

CV/ML頂級會議上的灌水文都有哪些特徵?如何快速判斷頂會論文是在灌水?
如何評價 Kaiming He 最新的 Mask R-CNN?
怎麼及時掌握/把握深度學習的發展動向和狀態?
Instance Segmentation 比 Semantic Segmentation 難很多嗎?
如何評價李飛飛和李佳加盟谷歌?

TAG:足球 | 機器學習 | 統計 | 計算機視覺 | 體育賽事 |