數據、大數據與歐洲杯

(首發於《南方都市報》,2016年7月12日)

體育比賽大概是公眾接觸到的數據密集度最高的領域了。從幾十年前宋世雄解說中國女排比賽,我們就習慣了聽取各項數據:這名球員年齡多少,身高多少,她今天已經得了多少分,中國隊的得分中發球多少分,扣球多少分,對方失誤送了多少分等等等。一邊欣賞感性的運動之美,一邊盤算實時數據,就好像後來的人打電子遊戲一樣。

這些數據絕非枯燥無味。數據顯示成就和潛能,數據代表勝負的趨勢,數據還是浮誇的資本和球迷之間爭論的終結者。美國有的專業棒球雜誌上沒有煽情的報道和圖片,全是各種數據表格,一個有極客精神的資深球迷光看這些數據就能達到高潮。

當然那時候數據就叫數據,並不像今天這樣有點統計數字就敢叫「大數據」。然而現在畢竟是所謂「大數據時代」,那麼在這個時代,要把數據玩到什麼程度,才算沒有辜負「大數據」這個稱號呢?

首先這意味著用數據預測比賽勝負。這得算是一個古老的行業,博彩公司一直都在這麼干。大數據的一個新玩法,就是使用「大量」的數據 — 以本屆歐洲杯為例,雅虎公司的科學家有個新創意[1],他們社交網路Tumblr上今年前幾個月但凡涉及到歐洲杯參賽球隊的對話全都提取出來,一共2400萬條,跟雅虎體育存的比賽數據結合起來分析預測。

換句話說這些科學家很重視球迷的群體智慧:球迷說哪個隊厲害,沒準這個隊就真厲害。結果可想而知,英格蘭隊 — 在球迷中的待遇相當於歐洲的中國隊 — 被這個模型高估了:雅虎預測英格蘭進四強,事實上英格蘭連八強都沒進。

雅虎大概沒搞明白信號和雜訊的區別,不過他們也許僅僅是為了顯示自己了解社交網路。一個更理性的預測應該純粹用比賽數據分析。某精算諮詢公司就用幾百萬次計算機模擬的方法預測法國隊的奪冠概率最高[2],其次是德國和西班牙,而事實上進入決賽的葡萄牙的奪冠概率僅列第七位。該公司號稱這個預測是不帶任何偏見的,但我必須指出這是一個法國公司。

大數據的更高級用法是直接用數據指揮比賽!早在2006年世界盃,德國隊守門員萊曼就在對阿根廷的點球大戰之前獲得一張教練給的小紙條,紙條上是科隆大學50名精英分析出來的阿根廷隊隊員踢點球的習慣動作和方位,並以此取勝。現在德國足協跟軟體公司SAP合作,搞了兩套升級版的大數據系統[3]。這回隊員和教練不用小紙條了,直接在iPad Pro上實時用圖形和視頻分析對手每個球員的攻防特點,球隊陣型和踢點球習慣。這些新一代球員 — 可能受從小打電子遊戲的影響 — 都熱愛閱讀數據,軟體得到了很好的應用,所以德國隊一遇到點球決勝還能繼續取勝……不過還是沒有進入決賽。

其實在我看來,大數據預測和大數據指揮都有一個本質問題:數據只代表以往的經驗。人作為一種有自由意志的動物是可以變的!如果你知道我踢點球的習慣 — 更確切地說是如果我知道你知道我踢點球的習慣 — 那我面對你的時候是不是應該改變習慣?難道我就不能多練幾種罰點球踢法?事實上,對策論告訴我們,最好的辦法是我有時候變有時候不變,讓你猜不到。而「猜不到」難道不是體育比賽最大的魅力嗎?

我認為大數據真正的價值並不是預測和操縱,而是分析和理解事實。比如說,有人認為歐洲杯比世界盃精彩,因為歐洲都是強隊,而世界盃上有很多代表政治正確的、湊熱鬧的弱隊,那麼這個說法有道理嗎?這個問題,讓一幫球迷喝著啤酒談一晚上也沒用,用數據說話就很有意義。而這裡的難點在於,從數據角度,什麼叫「精彩」?

紐約時報網路版有人撰文[4],用幾個指標來定義精彩:單場凈勝球差距越小越精彩,總進球數越多越精彩,射門數、傳球成功數、前場傳球成功數、以及球隊獲得球權以後平均形成射門的次數,都是越多越精彩。根據這些指標分析,歐洲杯至少像世界盃一樣精彩,過去五屆歐洲杯的平均指標跟世界盃差異很小。而單輪2012歐洲杯和2014世界盃的話,從凈勝球和傳球成功數這兩個看起來更重要的指標來論,歐洲杯要比世界盃精彩。

你可以質疑這些指標的合理性,但這些指標至少是可操作的,你很難找到更好的辦法說明問題。再比如說,總有球迷質疑梅西和C羅在國家隊比賽不如在俱樂部賣力,而著名預測網站FiveThrityEight則用數據說明[5],這二人(尤其是梅西)跟其他球星相比,在國家隊和俱樂部都是首屈一指的人物,只不過他們在俱樂部的作用的確更大而已。

數據不但能平息爭論,而且能發現隱藏的真相。英超是世界最強聯賽,那英格蘭隊為什麼就不行呢?《經濟學人》上一篇文章[6]用數據分析告訴我們:那是因為英格蘭的隊員在聯賽中都不是「角兒」— 最有創造性的傳球和組織都是外援包辦,輪不到他們。

這個關鍵數據是說英格蘭隊每隔22分鐘才能製造一次帶來射門的關鍵傳球,這個成績相當於英超中的埃佛頓隊 — 而像阿森納這樣的頂級球隊,這個數字是每隔14分鐘一次。

你並不能從這個數據中得出英超應該限制外援的結論 — 只有天才才能帶來充滿想像力的傳球,而英國就是不產天才又有什麼辦法呢?

作為一個只能隔岸觀火的中國球迷,請允許我在本文最後呼籲,趕緊歸化孔卡進中國國家隊吧。

---------------

[1] netimperative.com/2016/ Can big data predict Euro 2016 winner?

[2] mbe-intl.com/news/light FOOTBALL...vive la France! - 24 June 2016

[3] cnbc.com/2016/07/07/eur Athletes to analysts: How big data gave the German football team a leg up

Saheli Roy Choudhury | @sahelirc - Thursday, 7 Jul 2016

[4] nytimes.com/2016/06/15/ Euro Soccer: Just as Good as the World Cup, if Not Better By PETER EAVISJUNE 14, 2016

[5] fivethirtyeight.com/fea Jun 29, 2016 Dear Lionel Messi, Please (Please!) Don』t Quit Argentina, By Benjamin Morris.

[6] economist.com/blogs/gam The Achilles heel of English football, Jun 28th 2016, 17:26 by D.A.


推薦閱讀:

TAG:大数据 | 足球 | 足球欧洲杯UEFAEuropeanChampionships |