美國新奧爾良大學李曉榕教授簡論「影響因子」
近年來,「影響因子」被廣泛應用於各種學術業績的評定中,旨在測度學術成果的質量和影響。本文簡要論述相關的問題。
「影響因子」的定義和計算「影響因子」(Impact Factor, IF)的定義算式如下:
期刊A在X年的「影響因子」= 分子/分母
式中:
分子= 資料庫中X年的所有出版物對期刊A發表於(X–1)和(X–2)兩年中所有文章的總被引數
分母= 期刊A發表於(X–1)和(X–2)兩年的正式論文的總數
「正式論文」包括研究論文(Research Articles)、評述和綜述(Reviews,Overviews)、研究短文(Research Notes)、進展(Proceedings)等一般須經同行評審才能錄用的文章
「所有文章」包括「正式文章」、來信(Letters)、公告(Announcements)、評論(Editorials)、新聞(News)、通訊(Correspondence)、書評(Book Reviews)及其他所有刊登的文章。
「影響因子」和各種被引測度不能勝任對原創學術的質量和影響的有效測度
由上可見,「影響因子」計算一種平均被引率,因而更貼切之名是期刊的「被引因子」(Citation Factor)。而被引率在多大程度上能反映學術影響或質量,頗具爭議。簡述如下:
學術質量和貢獻與學術影響雖有正相關,但也很不同,這或多或少像暢銷書與學術專著之間的關係。學術質量和貢獻與長期學術影響的正相關較大,而與短期學術影響的正相關較小。連SCI和「影響因子」的創立者尤金·加菲爾德都曾說過:論文的影響與論文的重要性及意義是兩碼事。何況,IF只考慮兩年內的平均被引率,儘管有些根據,但它至多只能相當片面地反映期刊所刊論文「曇花一現」式的短期學術影響,而與長期經久的學術影響關係較小。這正像以下情況:一本書在出版後兩年的銷量與其學術影響、特別是學術質量和貢獻關係不大。
各種「被引」測度都無視期刊對不寫SCI論文的大量讀者的影響,比如工程和應用研究人員,因而至多只能片面反映對SCI論文作者的一定影響,而不能反映對應用和實踐的直接影響。所以,以平均被引率來度量影響,對工程和應用研究領域的期刊明顯不公。
被引率根本不考慮期刊所載文章的原創性和原創度。非原創文章有可能不被計入分母而被計入分子,所以也刊登不少非原創文章的期刊比只發表原創論文的純學術期刊在IF的計算上明顯佔優,非原創文章篇數的比例越大越佔優。而且,期刊的被引率有賴於可讀性、可獲得性(比如開源期刊)等眾多非原創性因素。
引源不同,所引意義可以懸殊。比如,一項成果被寫進廣為採用的教科書、被採納為某項政策的基礎,等等,與一般引用有天壤之別。被重要文章所引與被泛泛之作所引,不可同日而語。被一篇參考文獻寥寥無幾的文章所引,與被一篇參考文獻眾多的文章所引,也大有區別。然而,被引率對此都「等量齊觀」。
「引」的種類繁多,性質和意義各不相同,它包括正引(正面之引)、反引(批判性、反駁性之引)、他引、自引、實引(實質之引)、虛引(非實質之引)、褒引(褒揚尊敬贊同之引)、例引(舉例列舉比較之引)、崇引(崇拜而引)等諸多類型,以及迫引(被迫而引)、互引(友情互引、交易互引、團隊成員互引等)、轉引(未讀而引)、漏引暗引(用而未引)、諛引(阿諛奉承之引)、再引(誤歸榮譽給非首創者之引)、代引(不引原文而另引他文)等不妥行為。各種被引測度對這些區別「視而不見」。
IF的算式無視各個引用的不同作用和重要程度。在一篇論文中頻頻被引的主要參考文章、僅被引一次的無關之引,以及有力引用、適度引用、羅列引用、只引不用、表面引用、無關引用,等等,都被「一視同仁」。
被引率不等於被用率,被引的文獻不等於實際參考過的文獻:由於種種原因,「引而不用,用而不引」的現象並不罕見。此外,引用引證行為常常圖方便省力,容易造成馬太效應等「失真」現象。
上述各點均說明,作為測度學術影響、質量、原創度和貢獻的工具,「影響因子」及各種被引測度大有弊端和局限。
「影響因子」的影響因素
短時滯期刊/研究的IF高:
①若期刊的出版時滯長,則大多所引文獻老於兩年,不被計入IF算式的分子中,造成相應領域的IF偏低,因為學科領域自引和期刊自引在IF算式中所佔比例非常大。注意,不少審稿嚴格(要求審稿人數多且多次反覆修改)的高水平高質量期刊的時滯長,其IF嚴重受損,明顯低於其實際影響水平。②研究課題越能速成,其領域期刊的IF越高。比如,分子生物學、臨床醫學等領域的時滯遠比工程科學的短。③意味深長、影響深遠、打破常規的研究成果因不易理解而影響時滯長,短期被引率較低。④「引界」認可「先者為王」:作者常傾向於只引首先發表的,因而時滯短的更易佔得先機。總之,IF鼓勵有急功、多近效的學科、領域、期刊和行為。
學科領域的影響:
①由於種種原因,IF所用資料庫收錄的各學科期刊的總數差別很大,學科領域越是熱門新潮,其期刊越容易被收錄。比如,IF所用資料庫收錄的期刊總數曾有多年過半與生物學醫學有關。再如,在計算機科學,有些會議比SCI期刊的聲譽和質量高不少,卻未被SCI資料庫收錄。②學科領域自引在IF分子中比重極大,因此,相互易懂的大學科領域的IF較高,而「曲高和寡」、「隔行如隔山」相互難懂的小學科領域的IF較低,即越專精艱深的學科領域,IF越低。研究表明,生命科學期刊的IF值大都遠遠高於數學期刊(可達20倍左右);就平均IF而言,生物學領域最高,工程技術領域最低。③多產速效、人多勢眾的學科領域,IF較高。④一個學科領域錄用文稿的平均門檻越低,則可引論文越多、領域越大,因而IF越高。⑤有些領域在行文習慣上比其他領域的參考文獻數目大(比如有些醫學論文頻頻注引出處),因而相應的IF佔優。總之,不同學科和專業範圍的期刊,IF不具有可比性。
期刊種類的影響:
顯然,所有文章的總被引數> 正式論文的總被引數,這個差值越大,IF越高。這個差值的存在沒什麼道理,主要是因為難以得到後者而用容易得到的前者來代替。所以,也刊登不少非正式文章的期刊比只發表正式論文的純學術期刊的IF明顯佔優。這是醫學期刊IF較高的一大原因。由此很容易理解,如下幾類期刊的IF較高:快報、通訊等「短平快」類期刊(時滯短、差值大),綜合性期刊,多學科和交叉學科期刊,綜述類期刊或綜述文章比例大的期刊。所以,IF前幾名的期刊往往是生命科學和醫學期刊以及綜合性期刊《自然》和《科學》。期刊所覆蓋的學科領域越專一,IF越低。再者,與大期刊相比,小期刊IF的時間波動更大。
英語期刊的IF高:
IF所用資料庫中英語期刊的數目遠大於其他任一語種的期刊數,而且,同語種期刊的互引遠遠高於跨語種的互引。何況,英語是世界學術通用語,他種語言引英語遠遠多於英語引他語。
期刊被引率可迥異於論文被引率一種期刊的被引率是該期刊被引情況的一種宏觀測度,它約等於期刊中各論文的平均被引率(不全相等,因為上述所有文章數> 正式論文數)。所以,正如不能用一組大小各異之數的平均值來代替其中的一個數,也不能用期刊的被引率來代替其中一篇論文的被引率。研究表明,期刊中各篇論文的被引率,其分布極不均勻,很多期刊半數以上論文對期刊被引率的總貢獻只有10%。
論文類型的影響:就被引率而言,評述論文、綜述論文、介紹新方法的論文比原創研究成果類論文的明顯高,熱門領域的比非熱門領域的高,新領域課題的比老的高,爭議性大的論文比非爭議性論文高。
結論學術影響、質量和貢獻無法恰當合宜地量化,而且各學科領域千差萬別,難以統一。因此,要想得到一個普適於所有學科領域,評判學術影響和質量的公平而統一的量化指標是不可能的。可能的是,遵循同類比較原則,得到這樣一種各學科領域的通用評判方法,它充分考量學科領域各自的情況和特定變數。不同學科領域之間是難以做量化比較評判的。正因為如此,(非量化)同行評議才是國際學術界學術評判的長期傳統;湯森路透公司不提供橫跨各學科的分區或排名,而當下流行的中科院文獻情報中心科學計量與評價課題組的跨學科大類分區思想值得商榷,遑論其實現基礎是IF、被引率和一個所謂「普適於」各學科領域的經驗公式——布拉德福集散定律。
對科研產出的評判更重要的是深層的質量、原創度和影響,而不是表象的被引率。何況,「影響因子」更貼切之名是期刊的「被引因子」,而平均被引率只是期刊的短期學術影響相當片面而不夠恰當的測度,遑論靠它來測度其中一篇論文的質量、重要性和影響。IF旨在反映期刊的平均被引率,而不是其中一篇論文的被引率,因而很不適用於測度個人和單篇論文的影響。
不同學科和專業範圍的期刊,「影響因子」不具有可比性。速效多產易懂領域的期刊「影響因子」較高。
在學術評判中濫用IF有諸多惡果。例舉如下:
作為另一個佐證,國際上有越來越多的專家學者對IF的大範圍濫用表示不滿,比如可參見2016年7月14日的《自然》期刊,特別是Ewen Callaway的文章「Publishing elite turns against impact factor——Senior staff at societies and leading journals want to end inappropriate use of the measure」。美國微生物學會甚至在幾周前公開聲明將在它的期刊、網站、市場和廣告中刪去IF。
不同類型的期刊,其IF的可比性很小。熱門學科領域的IF值較高,IF的濫用明顯助長了東亞、尤其是國內科技界近年來日益跟風追潮的風氣。
IF太偏重於短期被引率,偏向於時滯短的研究領域和研究行為,因而片面追求高IF則鼓勵急功近利,這是國內及東亞科技界近年來日益心浮氣躁的原因之一。
IF的濫用是國內學術界學術論文引用引證不良行為日漸加劇的一大原因。
話說回來,對於評價一個國家、一個地區、一所大學等成員眾多的集合的總體情況,一個合理的客觀評價指標,在沒有成為被優化的指標時,相當有價值。但是,它一旦成為被優化的指標時,價值也就大打折扣。對於個人和小單位,採用這類客觀指標一般都大有弊端,往往是弊大於利。把「影響因子」用於測度個人和小單位的學術影響和質量,正是如此。
本文經李曉榕教授授權發表,原文鏈接地址:http://blog.sciencenet.cn/blog-687793-994339.html
小編:寒江
百納知識∣一個讓你擁有更多知識的地方
推薦閱讀: