再談等級分與棋手歷史地位:澄清常見誤解

如題圖。最近這個「世界最強圍棋選手積分」的視頻又火了一把。見【圍棋真好玩】世界最強圍棋選手積分排名歷史變化表 @柚子木字幕組。

這個視頻好在直觀。詳實的數據給人一種不容置疑的感覺,但其實裡面有問題,且在傳播過程中已經造成了很大誤解。

只想知道結論的讀者,可以只看下面這一段:

1、聶衛平在中國棋界的江湖地位無人可超越,不管等級分把他排在哪裡。

2、李昌鎬的統治期是1996-2005. 非常牛逼,但沒有視頻里(1991-2006)那麼牛逼。

3、古力在2004年才成為中國第一人,2006年才拿到第一個世界冠軍。1998年,古力還是個剛入段的小孩,而不是視頻里的世界第二。

4、柯潔登上公認世界第一人的寶座,是2016年初夢百合杯險勝李世乭,拿到三冠之後。在其它世界排名里,柯潔登頂的時間基本上都在2015年下半年。視頻里柯潔登頂的時間是2014年10月,太早。

5、造成這些誤解,一半是演算法的問題,一半是數據缺失的問題。

接下來詳細解釋一下。

此視頻採用的數據來自Go Ratings. 這個GoRatings等級分,我之前在專欄里批判過一番小論世界圍棋等級分 - 知乎專欄。之後,GoRatings等級分數據的維護者在弈客做出了回應。大致的內容是,等級分採用的WHR演算法是沒問題的,數據缺失是因為數據只能從go4go.net上面獲取;高排名的棋手比較準確,排名較靠後的棋手因為數據缺失,排名不準,這個也沒辦法。

這些我都完全理解。我對這位作者維護等級分數據的努力表示我的敬意。以下的內容,不針對作者本人,只為釐清GoRatings積分造成的常見誤解。

翻遍微博,B站的評論,常見的誤解有以下幾種:

1. 「聶衛平最高也就排到第二,還以為他多牛逼呢」

這個不是數據的問題。聶衛平巔峰的時候,確實不是公認的世界第一,而是最強的幾個人之一。視頻中聶衛平最高到第二,與第一差之毫厘。知乎上也有一個問題,提到GoRatings在更新數據以後,聶衛平曾經到過第一。但是,聶衛平的歷史地位,從來就跟等級分排名沒有關係。當中國人急需一針強心劑找回自信時,三屆擂台賽,聶衛平力挽狂瀾。滄海橫流,方顯英雄本色。知乎上吹聶衛平的答案很多,(有些我覺得甚至吹得有點過,)我這裡就不多吹了。

2. 「李昌鎬竟然15歲就排到世界第一,統治棋壇16年,不可思議

棋界公認的李昌鎬時代,是1996-2005年,統治棋壇十年。毫無疑問,李昌鎬是吳清源之後,世界圍棋第一人。柯潔想要超越李昌鎬的成就,難。

但是,GoRatings的數據問題太大了。看題圖,1990年10月3日,15歲的李昌鎬生涯戰績5勝3負,排名世界第二?

一個棋手才下了八盤棋,5勝3負就能排到世界第二? 這是GoRatings採用的WHR演算法的鍋。WHR演算法,全稱「Whole History Ratings」. 特色是在常見ELO等級分演算法的基礎上,根據當前棋手的全部歷史戰績,給出棋手在所有歷史時間點的後驗(Posterior)積分。簡單說,就是今天這盤棋的結果,不僅會影響棋手當前的積分,還會影響棋手一年前的積分。

如果棋手水平隨時間變化不大,且樣本(棋局)數量在時間上均勻分布(比如2015年某棋手下了60盤棋,2016年也下了60盤),那麼WHR積分確實能給出一個好的後驗估計。但是,GoRatings的數據缺太多了!特別是棋手生涯早期的數據。李昌鎬生涯正式對局總數在2014年10月23日就達到了2254局。再算上2015-2017的對局,應該接近2400局。但GoRatings上到目前為止也只有1725局(在視頻里用的數據缺失更多)。缺的數據大多數都在李昌鎬生涯的前期。

數據缺失,令WHR演算法在早期的誤差增大,擬合出一條起點很高的曲線,造成了李昌鎬在15歲就登頂的假象。

實際情況是,李昌鎬15歲確實在韓國國內已經鋒芒畢露,刷出一波空前絕後的41連勝(GoRatings到目前為止僅計入其中十來局)。不過,李昌鎬拿到第一個世界冠軍是在16歲7個月;在1990-1995年間,李昌鎬共獲得兩次世界冠軍。這段時間裡,李昌鎬是最強的棋手之一,但不是統治者。1996年,李昌鎬在決賽兩勝馬曉春,奪得雙冠,才正式奠定第一人的地位。2003年 ,李世乭崛起,李昌鎬的統治出現鬆動。在此期間,李昌鎬仍扮演「擂台賽鐵閘」的角色,在團體賽上成為韓國的守護神。2006年,李昌鎬在三星杯決賽輸給中國的羅洗河,在擂台賽輸給日本的依田紀基,正式走下神壇。

3. 古力

這個相比於其它錯誤,不太引人注意,但它是最荒唐的一個錯誤。1998年,古力0勝1負,登上世界第三寶座! 黑人問號.jpg 。古力1996年入段,1998年僅僅是他職業生涯的第三年。當年,古力還是個無名小輩。2001年,古力才拿到生涯的第一冠,還是「新人王」。古力後來在微博說,18歲的柯潔能讓18歲的古力倒貼目,不愧為棋界第一柯吹。你說一個無名小輩,怎麼就排到世界第三了呢?當年的數據是有多缺,才讓WHR演算法擬合出了這麼一條詭異的曲線?

實際情況是,2003-2004年,古力在國內狂攬五冠,同時在國際賽場表現不佳,被批「古一輪」。2006年,古力拿到首項世界冠軍。2009年2月-5月,古力兩個半月內連奪三項世界冠軍,前無古人,後無來者。2007-2012年間,李世乭與古力堪稱「絕代雙驕」,李世乭總體稍佔上風。

4. 柯潔

時間離今天越近,缺失的數據越少,GoRatings積分相對也就越準確。但這也只是相對。即使以今天的眼光看,2014年10月的柯潔,也只能算是一匹黑馬。彼時,柯潔手上僅有阿含桐山杯一項國內冠軍。柯潔拿下第一個世界冠軍,在2015年初。柯潔登頂的合理時間,參考其他ELO等級分,在2015年下半年。以棋界的眼光看,2016年初戰勝李世乭之後,柯潔才是無可爭議的第一人。

拜託三國棋院,請擱置爭議,趕緊把正式的世界等級分搞出來!謝謝三國棋院領導!


推薦閱讀:

輸贏不重要,那還有啥重要啊?
人機大戰II 第一場,柯潔輸了!
柯潔也晉陞圍棋10段,但一場也沒跟AI交手(U?ェ?*U可能都跑去日本了吧)
柯潔讓兩子最後一局盤面目數相同,根據中國規則需要還子嗎,這盤棋的結果到底是什麼呢?
柯潔重新定義了貼目多少的合理性嗎?

TAG:围棋 | 柯洁 | 李昌镐 |