索引作為文獻計量學分析工具的科學性與局限性

索引作為文獻計量學分析工具的科學性與局限性

王知津 王璇 馬婧

(南開大學商學院信息資源管理系 天津 300071)

索引具有兩大基本功能:檢索與分析。本文從作者索引、關鍵詞索引、引文索引三種不同類型的索引出發,探討了它們的文獻計量學分析功能,並分別討論了這三種索引用作文獻計量學分析工具的科學性與局限性。最後得出結論,應充分發揮索引的分析功能,以利於科研工作的進行。

關鍵詞 作者索引 關鍵詞索引 引文索引 文獻計量學 分析工具

Scientificalness and limitations of Index as a tool for bibliometric analysis

Wang Zhijin Wang Xuan Ma Jing

(Department of Information Resource Management,Nankai university,Tianjin, 300071)

Abstract: Index has two basic functions: retrieval and analysis. In this paper, we begin with three different types of indexes: author index, keyword index, citation index , and discuss their function of bibliometric analysis, and also discuss the scientificalness and limitations of these three indexes as a tool for bibliometric analysis. Finally concluding that we should give full play to the analysis function of index in order to facilitate the conduct of scientific research.

Keyword: author index;keyword index;citation index;bibliometrics;analysis tools

0 引言

索引被學術界公認為屬於二次文獻,與書目、文摘一樣同屬檢索工具,起著指南和工具的作用。索引是對某種文獻或某一文獻集合中所包含的各篇文獻,或所討論的各個局部主題,或所涉及的各種事項(如地區、人物、機構、事件、生物、礦物、產品、設備、公式、數據、著作等)以簡明的方式分別著錄標引,即確定其檢索標識和指出其所在位置,並將款目按一定的可檢順序排列和組織,以方便檢索的一種工具[1]。隨著信息技術的發展進步,索引工作與計算機技術相結合,標誌著現代索引的誕生。傳統的索引工作至今已發展成以資料庫編製為主的現代索引工作。現代的索引就是資料庫,與傳統索引相比,現代索引除了具備傳統索引所具備的檢索功能外,還具有傳統索引不具備的功能,例如,出版地、出版年等都可作為檢索欄位提供檢索(一般是作限定檢索),還可以實現多種途徑的單一檢索和多組配檢索等。現代索引豐富了檢索途徑和內容,是一種更為高級的索引,但其本質是並未改變。從索引的定義中不難看出,索引的最基本功能是檢索,我們稱之為第一功能。然而,索引不僅能在檢索過程中發揮作用,而且還可以被用作一種對科學活動進行計量、統計和分析的工具。這也是本文將討論的重點——作為文獻計量學分析工具的索引的第二功能。

1索引作為文獻計量學的分析工具

1.1 索引的功能——檢索與分析

索引作為一種檢索工具,它最基本的功能就是檢索。在充分利用其檢索功能的過程中,人們賦予了檢索另一個功能,即分析功能。索引的分析功能是在實踐中衍生出來的,由於索引的最基本功能是檢索,能為人們檢索提供方便,而檢索的目的在很多情況下是為了進行統計、分析,因此索引的另一功能也因此凸顯出來,作為一種文獻計量學的分析工具,在文獻計量學分析中發揮重要的作用。文獻計量學分析包括對文獻數量、作者、機構、關鍵詞的統計,以及文獻之間的引證關係的分析,可以作為科學評價工具,廣泛應用於個人、機構、地區、國家學術成果的評價;學科發展現狀的了解及趨勢預測;期刊的選擇和評價;論文或著作的學術價值及社會影響力評價等。根據索引類型的不同,索引的第二功能主要表現在基於作者索引的文獻計量分析,基於關鍵詞索引的文獻計量分析,基於引文索引的文獻計量分析等幾個方面,下面分別展開論述。

1.2 基於作者索引的文獻計量分析

作者索引,即用作者姓名作為索引款目的標識系統。作者索引是非常常見的一種索引類型。根據著述方式的不同,作者索引可分為個人作者索引和團體作者索引。個人作者索引記 載來源文獻的個人作者信息,如作者姓名、作者署名排序、作者機構和來源文獻號。該索引記錄來源文獻的所有作者,通過「來源文獻號」與來源索引關聯。團體作者索引主要用來存放來源文獻中的團體作者。該索引記錄了來源文獻的所有團體名稱、團體作者排序。也通過「來源文獻號」與來源索引關聯。作者索引以個人作者姓名、團體作者名稱或作者機構為檢索入口,針對於已知作者或作者機構的檢索及分析,針對性強,方便快捷。

通過作者姓名或團體作者名稱能夠檢索到某一作者或某一團體作者發表的文獻,通過對其發表的文獻的計量分析,可以了解某位或某些作者的論文發表情況,進而對相關作者的研究領域、研究主題、關注的焦點有所了解;以作者機構名稱為檢索入口,能了解某一機構的學術研究情況,了解其學術能力、研究主題分布等;通過對作者研究領域、研究主題的統計分析,可以將同一主題內的作者聚類在一起進行分析,以確定該領域、主題內的核心作者群;對這些核心作者的機構進行統計,又能分析出該領域、主題的核心研究機構;還可以用來分析著者間的合著率,等等。

1.3 基於關鍵詞索引的文獻計量分析

關鍵詞是直接從文獻的題目、正文或文摘中選出來,用以揭示或表達文獻主題內容特徵,具有實質性意義,未經規範化處理的自然語言辭彙。用這種關鍵詞做索引款目的標識系統,就稱為關鍵詞索引[2]。關鍵詞索引一般分為兩類:一類是帶上下文的索引,如題內關鍵詞索引、題外關鍵詞索引、雙重關鍵詞索引等;另一類是不帶上下文的索引,如單純關鍵詞索引和詞對式關鍵詞索引。關鍵詞索引是一種傳遞索引,有著臨時性、報道性的特徵。關鍵詞索引是一種以文獻作者為中心的索引,因為關鍵詞大都是由作者從論文篇名中抽出的不規範或只有少量規範的自然語言。雖然作者對於自己論述的主題是明確的,但對關鍵詞的抽取則可能是陌生的、自由的甚至是隨意的。關鍵詞索引通常用計算機編製,速度快、簡便容易,適用於快速報道文獻和進行瀏覽性文獻檢索。

基於關鍵詞索引的文獻計量分析,可以對某個主題內的文獻數進行統計,將相同的主題進行聚類,進而了解某個學術領域中研究的熱點、焦點;通過對文獻進一步統計分析,可以了解該領域內的學術帶頭人及帶頭機構;了解某一主題內學術成果情況(如發表論文),了解該主題的研究現狀、發展趨勢,等等。關鍵詞索引這些功能的基礎是其能揭示文獻主題內容,使用關鍵詞索引的優點在於它的臨時性、報道性的特徵,適於快速檢索,縮短檢索時間。然而,關鍵詞索引在文獻計量分析中也是有局限性的,這將在下面探討。

1.4 基於引文索引的文獻計量分析

引文,一是指引用資料,即在一部著作中引用其他作品的片段內容或他人所發明的定義定理;二是指參考文獻,是指為撰寫或編寫而引用或參考的有關文獻資料,通常附在論文、圖書或每章、節之後,有時也以注釋(標註或腳註)形式出現在正文中[3]。所謂引文索引,是一種以文獻之間的引用關係為基礎的文獻索引,即它以被引用文獻即引文為標目,其下列出引用過該文獻的全部文獻(來源文獻)的檢索工具[4]。它不僅具有一般檢索工具收錄的文獻目錄信息,並且收錄了文獻的引文(包括參考文獻、腳註、附註)的目錄信息,以及藉助共引和文獻耦合生成的相關文獻的信息,這是一般檢索工具所沒有的。引文索引提供了多種途徑的單項檢索和組配檢索,擴大了檢索範圍。

引文索引反映的是科研工作中對先人學術成果、經驗的借鑒、繼承和發展,同時也說明了先前的學術成果對後人的影響和滲透。引文索引是作者及學術研究成果的繼承性和發展性的客觀反映。因此,引文索引通過引用文獻計量分析,研究引文的數量、文獻類型、主題特點、時間及出處,能夠了解某一作者、機構、地區、國家的學術研究現狀和進展及其學術生產力情況;能夠用於選擇評價期刊,評價某一期刊的學術影響力;明確科研人員的文獻使用習慣;並且對考察文獻及著者的學術價值和社會影響有重要作用。通過分析文獻引證和被引證的關係,揭示文獻間的內在聯繫,了解學科間的聯繫點,從中挖掘新的學科生長點及其發展情況;了解學科、專業的歷史及發展,研究熱點和前沿領域,以及該領域內的學術帶頭人及其論著、帶頭機構等;以及某一學術觀點的產生、發展、現狀及趨勢,以及對其的評論、修正等;評估某個作者、機構、地區、國家的學術影響力和學術地位;某項科研成果的發展現狀、社會影響力及學術價值。

2 作者索引作為文獻計量學分析工具的科學性與局限性

2.1 查找的快速性和直接性

作者索引的使用是十分方便、快捷的,作者索引中包含了作者的相關信息。如在CSSCI的作者索引中,包括了作者姓名、作者署名排序、作者機構和來源文獻號等。只要輸入作者姓名,即可直接查找,並獲取所需文獻。相比之下,分類途徑檢索依賴於分類表,先查找分類表,獲取有關學科專業的分類號後,才能進行檢索;如果得不到相應的分類號,就無法進行檢索。主題途徑檢索依賴於主題詞表或者敘詞表,先查找主題詞表或者敘詞表,獲取一個或多個能夠表達檢索課題的合適主題詞或敘詞後,才能進行單個詞檢索或者組配檢索;如果得不到相應的合適主題詞或者敘詞,就無法進行檢索。在進行分類途徑檢索和主題途徑檢索時,都必須考慮所需文獻的學科專業屬性或者概念詞語屬性。關鍵詞途徑檢索雖然不依賴於分類表、主題詞表或者敘詞表,但在很大程度上取決於檢索者選取的關鍵詞是否與作者選取的關鍵詞一致,為了達成一致,是需要花費一番腦筋的。作者途徑檢索可以不必考慮所需文獻的學科專業屬性或者概念詞語屬性,省略了分類途徑檢索和主題途徑檢索必須考慮所需文獻的學科專業屬性或者概念詞語屬性,省略了關鍵詞途徑檢索的想詞、找詞的麻煩,只要有了作者姓名,即可直接進行快速檢索,從而方便了文獻計量分析。

2.2 查全率和查准率較好

就檢索的查全率和查准率而言,通常認為,由於分類標引和主題標引的不一致性是客觀存在的,所以,分類途徑檢索往往在保證了查全率的同時而失去了查准率;主題檢索途徑往往在保證了查准率的同時而失去了查全率;關鍵詞途徑檢索的查全率和查准率均不及主題途徑檢索。相比之下,從理論上講,一方面,通過作者途徑所檢索出來的文獻是該作者發表的全部文獻,除非存在著一人多名(對於中國現代作者而言,這種情況極少)或者被檢資料庫收錄不全的情況,因而查全率較高;另一方面,通過作者途徑所檢索出來的文獻都是該作者發表的文獻,絕不會是同一領域中其他作者發表的,除非存在著同一領域的同名作者,因而查准率較高。作者途徑檢索具有比分類途徑檢索、主題途徑檢索和關鍵詞途徑檢索好的查全率和查准率,來源於這個途徑檢索的直接性、不二性,因而,在一定程度上,可以保證文獻計量分析的全面和準確。

2.3 必須預先知道相關作者

不同於關鍵詞索引、引文索引等其他類型的索引,作者索引的檢索對象是作者。因此,利用作者索引的前提是要對相關學科、專業、領域的作者預先有比較全面的了解。這種預先的了解能夠使檢索過程更為快速和直接,並且有利於克服同名作者給檢索帶來的額外負擔。只有知道了相關作者的名稱,才能直接使用該名稱進行檢索,快速、準確、全面地檢索出自己所需文獻,進而按照具體的要求對該作者所發表的文獻進行統計,達到文獻計量學分析的目的。相反,如果對相關作者一無所知,則很難利用作者索引進行檢索。作者索引是針對作者而編製的索引,雖然具有自己獨特的檢索特性,但也存在必須預先知道相關作者名稱的局限性。不過,一般地講,同一領域的研究者對相關作者的名稱預先是知道的,因而使用作者索引進行檢索,通常不會存在困難。

2.4 同名作者的額外負擔

使用作者索引時,不可避免地要遇到一名多人和一人多名的情況。就一人多名而言,由於在中國現代作者中這種情況極為少見,因而不會對作者索引的檢索產生影響。而就一名多人(即同名作者)而言,在中國現代作者中這種現象並不罕見,因而會對作者索引的檢索產生一定影響,也必然給排除同名作者增加了額外負擔。然而,對於現代索引來說,解決這個問題並不難。一方面,通過資料庫的作者途徑檢索,在檢出結果中,除了包含作者之外,通常都會顯示某一文獻的全文、摘要和題名,對於同一領域的研究者來說,利用全文、摘要和題名來排除同名作者並定位自己所需要的作者並不難。另一方面,通過資料庫的作者途徑檢索,在檢出結果中通常也會顯示作者所屬機構甚至作者簡介,這就為排除同名作者提供了更加便利的手段,而同名作者屬於同一機構的情況則更是極為少見。對於同一機構中的同名作者,只能通過進一步調查、了解,從作者的研究領域、研究方向上做出判斷。

3 關鍵詞索引作為文獻計量學分析工具的科學性與局限性

3.1 反映文獻主題內容的科學性

關鍵詞是從文獻題目、摘要或全文中提煉出來的詞語或片語,它是文獻主題內容的反映。關鍵詞具有高度概括性,並且是具有實質性意義的詞,它能聚焦文獻討論的核心內容,將文獻的主題框定在一個範圍之內。因此,關鍵詞基本上能夠確定文獻的主題,用關鍵詞索引作為分析文獻主題的工具是有科學依據的。

關鍵詞能夠揭示文獻主題內容的前提是合理地標引關鍵詞。為了使關鍵詞的標引規範化,國家標準局頒布了一系列有關學術論文的國家標準,提出了對關鍵詞選擇的一些要求。關鍵詞的選取一般應遵循以下幾種原則。首先,應選擇能準確反映文獻主題內容的詞作為關鍵詞,關鍵詞應通過對題名、摘要、全文的瀏覽進行分析提煉而出,準確把握文獻的要點,關鍵詞的選取盡量做到準確、全面。同時還應避免某些無檢索意義的詞的使用,如冠詞、代詞、連詞、感嘆詞、副詞、形容詞和某些動詞等,以及可以應用於多個研究領域中、沒有特指意義的泛義詞(或通用詞)等,以及避免使用專業性的符號、英文縮寫等。此外,還應注意關鍵詞的排序問題,關鍵詞需要按照一定的邏輯順序排列,以利於反映文獻的主題內容和便於讀者瀏覽。如果文獻作者都能夠遵循選取關鍵詞的標準,關鍵詞索引的科學性毋容置疑。

3.2 揭示文獻主題內容的局限性

關鍵詞雖然能夠從一定程度上揭示文獻的主題內容,但是由於其短小精悍,並且數量有限,因此單憑几個關鍵詞就完全了解文獻的主題內容是不全面的、有局限的。同時,關鍵詞表達主題的專指性、準確性較差,容易產生誤檢,因而利用關鍵詞索引進行檢索的查全率和查准率往往受到一定影響。特別是那些內容較為豐富、涉及範圍較廣、主題不是特別集中的文獻,關鍵詞在揭示文獻主題內容上的局限性就更加暴露出來。比如,在利用關鍵詞進行檢索時,時常會出現這樣的問題:有些文獻內容不相關的文獻卻集中在一個關鍵詞之下。其結果,檢索出來的文獻數量很多,但質量甚差,真正符合要求的文獻很少,必須經過仔細篩選,才能得到符合要求的文獻。可見,利用關鍵詞進行檢索也會出現檢索質量低下、檢索結果不符合主題等情況。所以,文獻的主題內容體現在題名、關鍵詞、摘要、全文中,唯有綜合這幾項進行全面分析、綜合,才能透徹地了解一篇文獻的內容,單憑關鍵詞還不足以全面、準確反映文獻的主題內容。

3.3 關鍵詞使用的個體差異

與主題詞不同,關鍵詞是未加規範化的自然語言辭彙。由於沒有普遍進行辭彙的規範化選擇和控制,因而選詞質量比較粗糙,存在大量同義詞、近義詞和多義詞並存的現象。同一主題的文獻可能分散在不同的關鍵詞之下,而一個關鍵詞之下也可能包含不同主題的文獻,這些都是關鍵詞本身存在的問題。而不同作者、不同研究者由於個體使用詞語的差異,每個人的用詞習慣、喜好不同,可能出現用不同詞語表達同一含義的現象,這樣就把同一內容的文獻分散在不同關鍵詞下,不能集中在一起。因而對關鍵詞的選擇和確定就成為關鍵詞檢索的核心問題。在利用某個關鍵詞進行檢索時,既要充分考慮它的近義詞、同義詞、多義詞,又要考慮它的上位詞和下位詞及其相關詞,才能獲得較好的檢索效果。

3.4 關鍵詞標引的不規範性

目前,學術論文關鍵詞標引不規範的問題是關鍵詞索引用作分析工具的一大阻礙。雖然我國已制定了一系列有關學術論文關鍵詞標引規範的國家標準,但由於多數作者對這些國家標準缺乏了解與關注,缺乏規範關鍵詞標引方面的訓練,致使我國學術論文關鍵詞標引仍存在著許多不規範性,常見問題主要集中在幾個方面:

(1)錯標漏標。錯標和漏標是關鍵詞標引中常見的不規範之一。由於作者在選取關鍵詞時,沒有對文獻的主題內容進行深入分析,草率地選取幾個題名中的詞作為關鍵詞,忽略了摘要及全文中能夠反映文獻核心論點的重要辭彙,造成關鍵詞標引的遺漏。更有甚者,有的作者粗心大意,將關鍵詞錯標,使學術論文的嚴謹性打了折扣。這些會降低關鍵詞揭示文獻主題內容的科學性,造成漏檢、誤檢,影響文獻計量分析。

(2)選詞不準。關鍵詞標引的目的是為了解文獻的主題內容提供參考,即使在未讀全文之前就能對文獻的主要內容有個大致的了解。標引關鍵詞時應通過瀏覽題名、摘要、全文,正確理解和分析判斷論文的主題內容,進一步提煉文獻的主題概念。但有的作者在標引前缺少對論文主題內容的分析判斷,選取關鍵詞時抓不住論文的要點,選取的關鍵詞不能準確反映文獻主題內容。

(3)通用詞。通用詞是指不能揭示文獻核心主題內容、對檢索意義不大、可有可無的詞,如「研究」、「分析」、「意義」、「影響」、「啟示」、「趨勢」等。這些詞語對揭示文獻特定的主題內容沒有專指性,對檢索幾乎沒有幫助,甚至會給檢索增加無用功,導致文獻的錯檢,降低查准率。

4 引文索引作為文獻計量學分析工具的科學性與局限性

4.1 客觀反映文獻和作者的繼承性

與以作者、關鍵詞等作為標目而編製的索引不同,引文索引除了一般查詢外,還能提供文獻之間的內在聯繫。通過一篇被引論文,可以檢索到同一領域不同時期的各個論文。每一篇新文獻的誕生,都是作者在大量參閱前人研究成果的基礎上,吸取其精華,並進一步深入研究、思考,最終提出自己觀點的結果。科學的發展不是孤立的,而是在先前科學成果的基礎上,發展和繼承了曾經優秀的科研成果,並以此為出發點衍生出新思想、新成果。因此,科學的發展與繼承本身是一個相輔相成的過程。引文索引能夠將科學論文之間千絲萬縷的引證和被引證關係展示出來,而這種關係正是科學本身的繼承和發展關係以及學科之間的相互影響、相互滲透關係的反映。引文索引揭示的科學論文間錯綜複雜的引證與被引證的關係就像一幅「地圖」一樣,客觀地揭示了科學技術發展的特殊變化規律與走向[5]

4.2 定性與定量分析的基礎

通過引文索引,對專業人員論著之間的引用與被引用的現象進行統計、歸納、比較、抽象、概括等分析,這是一個定性與定量相結合的過程。關於引文索引的定量評價特徵,應該是毋庸置疑的。通過引文索引,對引用或被引用文獻數量進行統計,從而達到計量分析的目的,體現了引文索引的定量特徵。定性特徵則表現在,引用文獻的前提是要進行「同行評議」,選入引文索引中的文獻必定是經過同行專家學者閱讀、分析之後,承認它的價值,並引用在自己的文獻中的,這個過程實際上就是同行專家學者對引文選擇、評價的過程。此外,利用引文索引進行引文分析時,涉及到大量的統計數據和各種數學公式,但同時又需要對各種數據進行歸納、比較、抽象、概括[6],在這個過程中涉及抽象、比較等典型的定性分析方法。因此,引文索引用作文獻計量學分析工具,不僅有定量分析功能,而且還有定性分析功能,將定性與定量相結合,能夠更加客觀、全面地發揮引文索引的分析功能。

4.3 數據的廣泛性、開放性和客觀性

引文索引數據是從大量的來源期刊中進行篩選、參考、利用的文獻集合。其數量是巨大的,以CSSCI為例,自1999年創辦以來,至2009年已累計6,000,000條來源文獻數據和引文數據,僅2007年來源文獻就達93673條,引文850,593條[7]。每年收錄的22個學科的論文10萬篇左右,其收錄論文的作者包括國內外高校、科研機構、黨政部門及其所屬黨校、行政學院等院校、軍隊、企業等各類機構等單位的人員姓名也在10萬名左右。如此巨大的數據源彌補了數據中個別差錯造成的影響,保證了引文索引數據的廣泛性、客觀性。

引文索引是一種量化了的分析工具,具有客觀、公正、開放、透明等特點。然而,引文的前提是經過同行專家的閱讀、認同,相當於一種同行評議,並且引文分析時歸納、比較、抽象、概括等定性方法的使用也充分體現了它的定性特徵。引文索引將定性與定量相結合,彌補了單純定量分析的缺陷,增加了引文索引數據的公正性。這種定性定量相結合的方式,使得引文索引數據更加客觀、公正、開放,為利用引文索引進行文獻計量分析奠定了基礎,保證了其科學性和合理性。

4.4 使用範圍的局限性

引文索引作為文獻計量學分析工具,它分析的對象為學術成果,並且數據來源於學術期刊論文,不包含學術著作。它的研究對象、研究方法、研究工具和指標、研究成果主要是為學術研究服務的。因此,它的使用範圍也應有嚴格的界定,特別是用作量化評價工具指標,主要適用於學術研究工作及其成果的定量評價[8]。它只能為同行專家定性評價提供一種互補的定量工具[9]

另外,引文索引數據只是涉及學術研究成果中的很小一部分(即在部分學術期刊上發表的論文),完全排除了學術著作。而實際上,學術著作的引用比期刊上的論文更為廣泛。所以引文索引即使用作學術評價的標準也是很有限的。

4.5 引文數據分析的滯後性

引文索引中的數據是由該學科領域內的專家學者對他人研究成果的閱讀、分析、借鑒之後,將其作為引文運用到自己的文獻中的。學術創作是一個嚴謹過程,作者需要廣泛參閱相關文獻成果,並且加以分析、思考,最後字斟句酌地精雕細琢而成。從文獻的檢索、收集到閱讀、分析,再到文獻的寫作、完成直至最終定稿,都需要花費較多的時間,所以一篇文獻能夠作為引文被引用在文獻中也是一個消耗時間的過程。在此之後,才能由索引機構進行整理、編輯、核對,由於數據量巨大,這一過程同樣是非常繁瑣的,並且需要相當的時日。

因此,由於受到各種因素的限制,引文分析存在嚴重的滯後性。這種滯後性限制了引文數據的利用效率,它不可能超前於同行專家的認證而存在和利用,這也是引文索引的一大局限性。Garfield在對被大量引用論文的被引用情況進行研究分析後,將它們的被引用時機情況歸納為五類:高速飛彈型、流星型、遲開之花型、雙峰型和持久型[10]。可見,對於不同論文來說,其被引用的時機也是大不相同的,並呈現出一定的規律和特點。有的文獻一經發表就立刻引起學術界的關注,被廣泛引用,而有的則需要經過幾年甚至更久的時間才能被關注,體現出它的價值。雖然不同論文被引用的時機不同,但由於引文索引被引數據分析的反饋性和滯後性,必須經過同行專家的審閱、認同、引用,才能在數據統計分析中被認證。

4.6 來源期刊學科專業的差異性

在選擇期刊作為來源期刊為引文索引提供數據時,主要以期刊影響因子作為選刊的依據。由於不同學科特色迥異,學科性質、研究對象、研究方法也不盡相同,因而學術成果的表述習慣、表現形式也不盡相同,在引文中表現在引文數量、文獻類型、文種的不同,在學科期刊中表現在期刊影響因子的差別。有些學科間期刊影響因子存在很大的差別,比如生物學、醫學、化學類期刊的影響因子較高,而數學與工程技術領域期刊往往較低[11],甚至同一學科不同專業期刊之間也存在著影響因子的差異。而且對於研究領域廣泛、研究內容豐富的大型學科,與內容單一、研究面窄的小學科,或者較為冷僻的學科相比,其學科期刊影響因子存在較大的差異,加之來源期刊數量的限制,使得某些較為冷僻的專業和小學科專業不能入選,這是有失公平的。

在入選不同學科專業期刊時,還存在一個時間跨度的問題。影響因子的一般定義只是近兩年的期刊論文的被引數量與其刊載的文獻總量的比值,時間段限定在近兩年,容易忽視時間跨度對期刊影響因子的影響。比如,對於一些新興學科和交叉學科,新技術的發展迅速帶動著學科的進步,對於近兩年的研究成果關注程度會比較高,文獻引用率也較高,然而對於另外一些基礎學科來說,其原理的發現可能需要幾年甚至幾十年的時間,需要時間的檢驗才能不斷發掘出它的價值。可見,來源期刊學科專業的差異性給利用引文索引進行計量分析、科學評價帶來的局限。

此外,隨著科學技術和社會的發展,學科間的融合和交流日漸增多,跨學科跨專業層出不窮,這也決定了這些學科專業期刊的多學科性。如果一種期刊涉及多個學科,這種期刊就會被分別歸為多個學科期刊排序表中,從而出現相關學科期刊因影響因子大而排在本領域主要專業期刊之前的不合理現象[12]。並且這些期刊刊載不同學科專業文獻的比例不同,造成了被引數據的差異。同時,跨學科期刊在歸類上是不確定的,隨著期刊自身的調整、發展,期刊歸類也可能發生變化,其被收錄為來源期刊的可能性也發生著變化。

4.7 負引現象及被引強度的差別

引文是作者根據所寫作文獻的主題而進行檢索、了解他人先前的研究成果,為了支持自己的論述而引用的文獻和參考的資料等。作者引用的目的是為其論述提供背景依據、參考、數據支持等;或是用來突出強調他人的觀點、對別人的研究成果予以承認;亦或是對他人的成果提出質疑,進行反駁、辯論或糾正等。因此,引文是作者對於被引文獻的一種取捨或評價,這種評價既有正面的,亦有中性或負面的,因此可以將引文分成正面引文、中性引文和負面引文[13]。在文獻引用類型中的「負引」,通常指的是批評性、批判性、反駁性的不同觀點、意見的引用[14]。在利用引文索引進行文獻計量分析時,正引和負引之間存在的差別是不可否認的,並且這種差別是引文數據本身難以區分和判定的[15]。由於負引現象的存在,雖說能夠揭示其影響力,但是不足以反映文獻的質量和創新能力。因此利用引文索引進行文獻計量分析具有一定的局限性。

此外,被引文獻存在著被引強度的差別。從引文深度上,可以分為深度、中度和淺度引文。有學者曾從引用形式上將引用分成「點對點、面對面、點對面、面對點」等四種引用類型。[16]其中,點對點引用,即來源文獻引用被引文獻的某一點來說明其論文中的一點;點對面引用,即來源文獻引用被引文獻的整篇來說明其論文中的一點;面對點引用,即來源文獻引用被引文獻的某一點來展開其整篇論文;面對面引用,即來源文獻全面引用被引文獻來展開其整篇論文。由於被引強度的差別,給學術評價造成一定的影響,評價時要綜合文獻內容進行全面的分析。

如果深入探討引用類型和引用深度之間的關係,有研究表明:正面引用的數量隨著引用深度的加深而增加,中性引用的數量隨著引用深度的加深而減少,負面引用則呈中間大、兩頭小的分布。從數量上看,淺度引用數量最少,中度引用次之,深度引用數量最大。從深度上看,正面引用的引用深度最深,中性引用和負面引用的引用深度較淺。與深度引用相比,三種類型在淺度引用和中度引用上的數量差別較小,所得結果肯定了正面引用的有效評價作用。負面引用的引用深度比較低,絕大部分屬於中度引用,淺度引用次之,深度引用最低 [17]。通過對引用類型和引用深度之間關係的研究,揭示了引文中正面引用和深度引用的有效評價作用,能夠從一定程度上評價文獻的學術價值、影響力及創新價值等。而負引現象,或者是中度引用、淺度引用等,不能對文獻的學術價值及創新價值做出評價。由此,在引文索引進行計量分析、學術評價時,不容忽視負引現象以及引用深度的差異帶來的局限性。

4.8 影響因子在期刊評價上的局限性

影響因子是從引文角度測度期刊重要性及影響的一項參數,通常表示某種期刊中論文的平均被引用頻率(Citation Rates),是指某刊被引次數與載文量的比值 [18] 。美國期刊影響因子原是為《科學引文索引》選擇來源期刊(統計源)而研製的[19]。它作為一種計量指標被用來評價各類期刊的質量優劣,反映期刊的學術影響力。但是,用影響因子來評價期刊也存在著一定的局限性。美國科學情報所(ISI)指出影響因子在使用時(主要針對學術評價)應該慎重,必須考慮到期刊類型的不同、學科之間的差別、文獻款目類型差別、自我引用的頻率、期刊是否為ISI收錄和期刊名稱是否有過變更等諸多因素的影響[20]

首先,影響因子只能用於評價期刊,而不能用來評價個人或機構的學術成果,這是由影響因子本身的特性所決定的。其次,影響因子的適用範圍只局限在同學科期刊的比較。由於不同學科之間學科性質、發展歷程、研究範圍、研究方法的不同,導致了期刊影響因子不盡相同,甚至存在很大的差別。並且在不同業界間引用形態和傾向也是大為不同的[21]。比如,正在發展的新型學科和歷史深厚的古老學科、理論研究型學科和應用研究型學科在引用動機和引用規範上有很大差異,一個大學科(有眾多研究者或熱門研究領域)和一個小學科在引用程度上也有較大差異[22],影響因子值也因而也存在較大差異。如果只以影響因子作為期刊的評價指標,會對某些學科的發展造成不利影響。此外,期刊影響因子還受到期刊類型、期刊語種、期刊名稱的變更、統計時段、統計來源資料庫等多因素的影響。這些因素的作用,使得影響因子用於期刊評價結果的客觀性、公正性受到影響。況且只利用期刊影響因子評價期刊不免有局限性,應該結合瞬時指數、總引文數、總論文數、引文半衰期等《期刊引用報告》提供的其他計量指標進行期刊的多維評估[23]

5 結語

在信息化、數字化高速發展的今天,索引是幫助人們搜尋信息、有效利用文獻的工具。在索引的兩大功能即檢索與分析中,與第一功能檢索相比,索引的第二功能——文獻計量學分析工具似乎更受到人們的關注。本文分別探討了幾種不同的索引類型:作者索引、關鍵詞索引、引文索引的文獻計量學分析功能,並總結了各類索引作為文獻計量學分析工具的科學性與局限性。索引的文獻計量學分析功能是有一定的科學依據的,但由於受到各種原因的限制,又表現出其局限性。在這些局限性中,有些是可以通過採取一定的措施進行克服或者避免的,然而有些則是索引自身的性質決定的,不能輕易消除。在今後的科研工作中,我們能做的就是充分利用索引方便快捷的優點,並盡量減少人為因素導致的誤差,使得索引的文獻計量學分析功能更好地用於科研當中。

推薦閱讀:

東天目山打佛七的一些參學分享
公民不服從的政治學分析
相學分享:痣相大全-解析你身上的痣!
美女配醜男現象的經濟學分析
心理學分享

TAG:文獻 | 科學 | 工具 | 索引 | 計量 | 計量學 | 局限性 | 學分 | 作為 | 分析 |