和張公子比比贊同數
截止我開始動手寫這篇文章,我的贊同數是40293,張公子@張佳瑋 的贊同數是2637024,絕對差距近260萬,相對差距是65.45倍。不管從哪個角度看,都是被張公子完虐的節奏。(唯一超過張公子的大概就是我是兩個話題的優秀回答者,而張公子只有一個(笑))
比贊同數這種事情,當然不止發生在知乎上。科學界也喜歡比「贊同數」,當然他們沒有科學界專用版本的知乎,這裡的「贊同數」實際上指的是另一項指標:「論文被引用次數」。
科學家是怎麼通過這一指標來比較不同的學者的呢?比較總被引用次數是一種辦法,但是這種辦法在某些情況下未必符合我們的直覺;舉個極端的例子,比如一個學者寫了2000篇論文,每篇只有10引用,而另一個學者寫了1篇論文,但是這篇論文有19999引用,前者的總引用次數比後者多一丁點,但是我們一般都會覺得後一位學者對學科的貢獻要更大一些。換句話說,總被引用次數是和論文的數量與質量同時相關的指標,但數量和質量之間並不是完全替代的,事實上我們會更加註重質量超過數量。
為了解決這個問題,熟悉科學界的童鞋們肯定知道有一個概念叫「h-index」:如果某個學者有h篇論文的引用數量達到至少h次,那麼這位學者的h-index就是h。作為類比,@曾加 去年曾經拿小號偷偷地搞過一個大新聞:如何拿到知乎用戶H-index的排名? - 互聯網,用h-index(和推廣的h-10/h-100/h-1000/h-10000指數)給頂層的知乎用戶們排了個座次。
h-index這個指標最早由Hirsch在2005年的論文「An Index to Quantify an Individual』s Scientific Research Output"中提出,距今也不過十餘年時間。雖然它聽起來很有道理,但是它(以及其它同類的指標)都有一個重大的缺陷,那就是依賴於直覺和經驗,而沒有得到充分的justification。因此,h-index存在一些問題也就不足為奇了:
首先,h-index對於發表論文數較少的學者不利,就以上面我們舉的那個極端例子來說,第一位學者的h-index是10,而第二位只有1,原因是第二位學者只有這一篇論文,所以h-index的結論還是和我們的感受相悖。作為修正,@曾加 採用的是h-100這樣的指標,即「有h篇回答獲得了至少100h的贊同」,而科學界的做法其實也很類似,Egghe在其2006年的論文中就提出了改進h-index的g-index,即「有g篇論文獲得了至少g^2次引用」。儘管採用修正的指標後,極端例子中的兩位學者之間的差距迅速縮小,但是這並沒有從本質上解決發表論文數較少的學者處於劣勢的問題。
其次,為了比較不同學科的學者,必須對引用數做re-scale,因為不同學科的論文平均被引用次數可能不盡相同,例如數據表明,生物學論文中達到100次引用的論文佔比就是航空工程論文的50倍。然而,h-index這個指標對於具體的引用次數是敏感的,結果是在re-scale前後,可能會出現學者的排序逆轉的情況。舉個假設的例子,現在有兩個宏觀經濟學家A和B,他們各自發表了3篇論文,引用數分別是(8、9、10)和(1、20、30),這時候A的h-index是3,而B的h-index數是2;我們再假定宏觀經濟學論文的平均被引用次數是100;現在我們要把A和B拿來和一個產業組織理論經濟學家C進行比較,而產業組織理論論文的平均被引用次數假定是10,那麼就得把A和B每篇論文的數目除以10,新的引用數變成了(0.8、0.9、1)和(0.1、2、3),A的h-index只有1了,而B的h-index仍然是2。也就是說,引入一個新的學者對原有學者的順序造成了變化,這顯然不是一種合意的性質。
(所以說,我和張公子的比較還得考慮到籃球話題和經濟學話題的平均贊同數才對嘛~!)
那麼,如果不用h-index,我們又該用什麼指標呢?答案其實比你想像的要簡單:我們用Euclidean Index,也就是將這個學者發表的所有論文的被引用次數視為一個坐標,計算這個坐標到原點的歐幾里德距離。聽起來簡單粗暴,但是這個指標比h-index要靠譜得多:發表於上個月的American Economic Review中的論文"How to Count Citations If You Must"中(這是論文地址:http://pubs.aeaweb.org/doi/pdfplus/10.1257/aer.20140850),作者Motty Perry和Philip J. Reny給出了五條恰當選擇的性質,Euclidean Index(及其單調變換)是唯一滿足全部性質的指標。(其實我不太明白為什麼經濟學頂刊會發一篇這樣的論文……)
這五條性質分別是:
(1)單調性(Monotonicity):新增一篇被引用次數充分多(判斷充分多的標準取決於原有的論文)的論文,指標不會降低。
實際上,單調性可以加強為「新增一篇論文,無論引用次數多少,指標都不會降低」;注意單調性討論的是新增一篇論文的情況,而不是現有的論文引用次數增加。
(2)獨立性(Independence):給兩位學者同時新增一篇被引用次數同樣多的論文,指標的相對大小不發生改變。
h-index就不滿足獨立性,比如A有10篇論文各10引用,B有5篇論文各15引用,現在給兩人增加10篇15引用的論文,每增加一篇,A的h-index始終保持10,而B的h-index就從5不斷上漲到15。
(3)深度相關性(Depth Relevance):如果將一篇論文替換成總引用次數相同的兩篇論文,指標將嚴格下降。
這條性質體現了我們看重質量勝過數量。
(4)尺度不變性(Scale Invariance):如果將兩位學者所有論文的被引用次數乘以同一個正的常數,指標的相對大小不發生改變。
這條性質避免了比較不同學科的re-scale的影響。
(5)方向一致性(Directional Consistency):如果兩個學者去年的指標相同,今年兩人都新增了同樣多的引用之後指標仍然相同,那麼明年再增加同樣多的引用,兩人的指標仍然相同。
這個性質是唯一一條看起來很tricky的性質,舉例說明一下:比如說去年兩個學者各自發表了3篇論文,分別獲得了a=(a1, a2, a3)和b=(b1, b2, b3)次引用,去年兩人的指標相同;今年兩人都新增了同樣多的引用d=(d1,d2,d3,d4)(注意d4代表了一篇新論文),因此分別有(a1+d1, a2+d2, a3+d3, d4)和(b1+d1, b1+d2, b1+d3, d4)次引用,今年兩人的指標還是相同;那麼,明年如果兩人又新增了d=(d1,d2,d3,d4)次引用,明年兩人的指標必然還是相同的,甚至對於任意常數c>1,兩人分別有a+cd和b+cd次引用時,指標仍然是相同的。
(實際上作者還要求了第六條性質,即連續性(Continuity):如果兩位學者發表了同樣多的論文,被引用次數構成的兩個坐標之間距離充分近時,對應的指標之差充分小;這裡的距離不一定要是歐幾里德距離,也可以是曼哈頓距離等等)
通過一系列推導作者證明了,Euclidean Index,即以引用次數為坐標的點到原點的歐幾里德距離(及其所有單調變換,比如)是唯一滿足上述全部五條(其實是六條)性質的指標,而且這五條性質中不存在冗餘(換言之也就不能相互證出),放棄任意一條性質都不能保證唯一性,比如:
放棄單調性:
放棄獨立性:
放棄深度相關性:
放棄尺度不變性:
放棄方向一致性:
放棄連續性:字典序
好了,最後我們也來移植一下,這是博弈論話題下的活躍回答者名單:博弈論-活躍回答者,我們嘗試算一下Euclidean Index和h-index:
@Manolo (1261, 810, 452, 273, 238, 62, 49, 49, 43, 25, 15, 14, 8, 7)
EI = 1610.389
h-index = 12
@長澤雅美 (105, 64, 52, 43, 28, 25, 18, 15, 15, 13, 12, 2)
EI = 148.9094
h-index = 11
@曉風殘月 (237, 166, 124, 55, 48, 43, 42, 36, 8, 6, 4, 1, 1)
EI = 330.8429
h-index = 8
@前鋒TX (140, 129, 117, 61, 50, 22)
EI = 237.9811
h-index = 6
我自己 (467, 228, 39, 33, 26, 21, 17, 15, 14, 14, 13, 12, 11*4, 10, 9, 8, 7*3, 6*4, 5*3, 4*9, 3*10, 2*6, 1*11, 0 ) (一看就是我最水……)
EI = 525.7214
h-index = 12
@榮健欣 (119, 103, 54, 32, 20, 16)
EI = 171.3651
h-index = 6
@慧航 (485, 231, 96, 30, 16, 8, 7)
EI = 546.8738
h-index = 7
@陳茁 (125, 110, 103, 47)
EI = 201.3529
h-index = 4
@胖子鄧 (462, 106, 106)
EI = 485.7118
h-index = 3
@曾加 (7944, 295) (要不我偷偷地去把豆子那道題的博弈論標籤給去掉……)
EI = 7949.476
h-index = 2
@Lindisfarne (1246, 77, 25, 6)
EI = 1248.642
h-index = 4
@董可人 (438, 42, 24)
EI = 440.6631
h-index = 3
從這個結果來看,感覺直接應用過來還是有點問題的……因為比較的是在博弈論話題下的回答,而且博弈論是比較細分的話題(不像「經濟」話題下面林子大了什麼鳥兒都有),也就大致可以認為相當於「同一學科的論文」,本來應該是不用re-scale的;但是考慮到曾加拿到近8000贊的那個回答,也許還是按照每個問題的平均贊同數re-scale一下比較好呢……畢竟每個問題不止有一個話題,所以可能受到幾個話題標籤的共同影響也說不定呢……
(Photo Credit: "thumbs up" via Visualhunt)
推薦閱讀:
※遊戲與微觀經濟學 I. 稀缺性(Scarcity)
※成為一名經濟學家需要哪些準備?
※30不立 - 美國的8090後是怎麼變成窮人的 (2)