圍棋制霸第一關:有個罕見姓氏
大凡關注圍棋的朋友,估計很多人注意過,中國圍棋水平最高的一批人中,不少人的姓氏很罕見。今天我就在這裡給大家分析一下。
手頭的主要資料是中國圍棋協會官網的排名。至於各姓氏的排名,以《四百大姓》一書的數據為準。這裡把全國排名一百以內的大姓稱為常見姓,一百以外的稱為少見姓。
那麼我們看看現在圍棋前一百名里的少見姓:(左側數字為選手現積分排名,截止2017年10月。右側數字為其姓氏在全國所有姓氏中的排名)
1 柯潔 145
2 羋昱廷 400+
3 時越 187
4 連笑 198
5 柁嘉熹 400+
7 辜梓豪 340
8 檀嘯 386
19 古力 192
21 童夢成 148
33 黨毅飛 207
35 古靈益 192
37 鄔光亞 226
46 朴文垚 301(朝鮮族)
47 於之瑩 375
48 安東旭 112
57 牛雨田 108
58 戎毅 371
61 國宇征 313
66 俞斌 134
70 常昊 103
88 甘思陽 137
90 佟禹林 221
一共22個人,也就是佔比22%。
中國的前一百大姓,大約佔總人口的84.8%;101-200名的姓氏,佔大約8.3%;201-300名的姓氏,佔2.6%;301-400名的姓氏,佔1%;401名以後的姓氏,佔大約1.3%;此外還有2%的人口是沒有姓氏的少數民族,如藏族的旺姆、卓瑪,蒙古族的巴特爾等。
也就是說,101名以後的姓氏,理論上應該佔全國人口的13%左右。這裡的22%這個數據,明顯偏高了。
還有更高的。如果我們只看前50名,那麼裡面有15個少見姓氏,佔30%。如果我們只看前20名,那麼裡面有8個少見姓氏,佔40%。而只看前十名的話,裡面竟然有7個少見姓氏,佔70%!!前五名全是!!而且羋昱廷的羋、柁嘉熹的柁,都是四百名開外的姓氏,人數都在八萬人以下。(《羋月傳》出來之前,這個羋字會讀的人不太多,但是它畢竟是一個來龍去脈清晰的姓氏。柁姓就不一樣了,查不到任何資料,有人說是外族姓氏譯音。考慮到柁嘉熹是黑龍江人,而且有大鬍子,說不定這是來自於俄語譯音的姓,比如陀思妥耶夫斯基之類的。)
所以如果我們看圍棋新聞,因為排名高的選手出鏡率高,大家就會自然產生「這些人的姓氏都好少見啊」的感覺。
如果我們看前100名中各姓氏的人數,是這樣的:李8 王6 張4 陳4 楊3 黃3 周3 范3 劉2 孫2 朱2 胡2 謝2 韓2 曹2 彭2 陶2 (其餘1人的姓氏不再一一列出)。【註:這裡的名單不是最新的,如果有更新會在此說明。】這裡面稍微有點統計學意義的,可能是范姓和陶姓比例高。范姓以總人口的千分之三點多,貢獻了3%;陶姓以總人口的千分之二,貢獻了百分之二。但是,偶然因素確實無法排除。另外值得一提的,是大姓吳、徐在前一百名里被剃了光頭,讓人(尤其是我)很無奈啊……在101-200名里出現了四位姓吳的,讓吳姓稍感欣慰;但是對於徐姓,前200名仍然是光頭……
這種罕見姓氏扎堆的情況,我目前想不到比較合理的解釋。有一個領域複姓稍為多見,即演藝主持傳媒領域,如閭丘露薇、尉遲琳嘉、歐陽夏丹,這可能是因為擁有一個比較獨特的名字,易於讓人記住,會給此類從業者帶來一定的優勢。但是圍棋比拼的是腦力,更細說來是計算能力、記憶能力,很難想像擁有稀有姓氏的人在學習圍棋時會得到更多的正反饋。
如果說稀有姓氏與智商直接相關,也難以自圓其說。中國的姓氏代表父系,對於男性來說與Y染色體有一定的關聯。但是決定智力的基因幾十上百個,分散於各個常染色體上,與Y染色體或者說姓氏沒有很好的對應。除非我們先假設存在某些個「天才基因」,而常見姓氏的擁有者經歷了更多的基因混合,天才基因流失較多;而稀有姓氏的擁有者的家族長期族內通婚,天才基因仍然保持了較高的濃度……
另一點比較奇怪的是,這種少見姓氏扎堆的情況,不是一開始就有的。明末有大國手過百齡,這個過姓足夠少;他的後代有民國時期高手過惕生。我們從建國後開始分段來看。初期,九段的姓氏一般比較正常,聶衛平、俞斌、常昊已經算是少見姓了;從古力開始,芮乃偉、豐雲、朴文垚、時越、羋昱廷、柁嘉熹、柯潔、黨毅飛,少見姓突然多了起來。不知道為什麼。
其實分析這些高手的籍貫,也很有意思。我這裡選取建國後的九段42人,再加上現在排名前20的非九段,一共50人。統計得出分省籍貫排名:
上海10人
河南6人
浙江4人
北京3人
廣東3人
四川 江蘇 重慶 湖北 黑龍江 遼寧 河北 山西 2人
陝西 貴州 吉林 湖南 福建 雲南 山東 江西 1人
哪些省份剃光頭了?天津 安徽 甘肅 青海 寧夏 內蒙古 新疆 西藏 廣西。天津是曲藝之鄉,或許是性格太跳脫了坐不下來?西部省份氛圍不夠,可以理解。安徽就不知道為什麼了。
上海是當之無愧的圍棋中心,圍棋氣氛濃厚。河南人數第二出乎意料。另外值得注意的是,大部分高手都是來自於直轄市、省會、大城市,或者文化底蘊厚重的城市,如河南的六人,分別是洛陽3人,開封2人,鄭州1人。值得注意的是浙江的四個人都來自較小的地方,馬曉春(嵊州),俞斌(天台),陳臨新(臨海),柯潔(麗水)。
忽然又想起來航天員選拔。圍棋高手是全國智力(或者說算力)最頂尖的一批人,航天員是全國身體素質最頂尖的一批人。目前已經有11位中國航天員進入太空,他們的籍貫分布是這樣的:
遼寧2人
黑龍江2人
山西2人
河南2人
江蘇 湖北 山東 各1人
其中河南的陳冬和劉洋都是鄭州人,鄭州也成為國內第一個產生兩位航天員的城市。總體來看北方9人,南方2人,北方壓倒南方。
(綜上可見,河南能文能武,你值得擁有。)
說回圍棋高手的姓氏問題,雖然是個P遠小於0.05的事件,但其原因很可能永遠都得不到解釋。或許純粹就是巧合,誰知道呢。說不定再過一二十年,又是大姓稱霸棋壇了。各位朋友有什麼想法的,請不吝賜教。
17年11月16日第一次更新。針對比較集中的問題解答一下。
多謝大家捧場,評論和私信里都有朋友給我提到一篇文章,《姓氏越稀有,越有可能成為精英姓氏?》鏈接:姓氏越稀有,越有可能成為精英姓氏?
這個原始研究論文貌似還是英文的,我讀過一部分。個人認為上面這篇文章,並不能解釋我提出來的問題,即,為什麼中國圍棋排行榜的前列,被稀少姓氏「霸佔」了?
其實這是一個比較簡單的概率題,隨便選一個中國人,他的姓氏屬於前100大姓的可能,是84%也就是0.84,屬於第101名以後的小姓的可能,是14%。剩下2%是少數民族,暫不考慮。
那麼,隨便選一個排行榜,其前五名都是小姓的概率,是0.14^5, 也就是0.0000538. 這個概率已經小到可以忽略不計了,但是現在真實發生了,所以我還是懷疑有些深層次的原因。
尤其有趣的是,第101-200名的姓氏我也統計了,小姓大概15人,與14%的人群總分布吻合很好,而且零散分布不扎堆,不像排行榜榜首,前五名全是,前十名里佔七個。
關於那篇精英姓氏的文章,其實應該這樣理解:姓氏規模越小,「出息」的分布越離散,所以有些小姓更容易出精英,同時有些小姓更容易出廢柴。把所有的小姓綜合起來統計,如果不考慮人文傳承等因素,那麼這14%人群里出精英的概率,還是和總人群里出精英的概率一樣的。
也就是說,假如說平均10000人里出一個進士(實際上比這個少太多了),那麼一個10000人的小姓,只要一個家族努努力,出來五個進士,兩三代人的時間就能化身為精英姓氏。而一個1000萬人的大姓,按平均數算能出1000個進士,但是你要讓他們出5000個?還不如直接造反當皇帝快一點。
另外,前200名里出現的小姓,與那篇研究中列出的「精英姓氏」諸,竺,茅,濮,裘,巢,惲,端木,鈕,忻,薩,笪,宓無一重合。整個名單,與江浙一帶的「著姓」如錢、沈、顧、陸、朱的重合也不甚好,尤其是錢姓,出來的科學家、詩人、文學家不計其數,在圍棋方面反而不顯。
說「樣本量太小」的朋友,我不知道該怎麼說了。
推薦閱讀: