如何快速篩選到想要的核心文獻?

僅僅是萬方中關於期刊的文獻就有 36 000 000+ 篇,而 Pubmed 中則有 27 000 000+ 篇。每一個資料庫的文獻量都可以用「浩如煙海」形容。

當然,你根據自己需要的主題進行檢索所得的結果並沒有這麼多。即使如此,檢索的文獻量少則數十上百篇,多則上千篇,難不成你還要將所有的文獻都瀏覽一遍,才知道哪些文章對你的研究是有幫助?即使是簡單的瀏覽標題,也能讓你兩眼昏花,更何況進一步閱讀摘要,甚至是全文。

那麼,接下來的關鍵就來了:

如何在「多如繁星」的文獻中,找到屬於你的「北斗星」?如何評價哪些文獻對於你整個科研思路是有意義的,哪些文獻屬於重量級,而更多的文獻是沒有太多「利用價值」的?

所謂:「眾里尋他千百度,驀然回首,那人卻在燈火闌珊處」。這便是科研中的利器之一:「文獻篩選」。

接下來,我會分篇章進行圖文詳細概述,如何在常見文獻庫中進行高質量文獻的篩選,其中包括國內常見的資料庫:知網、萬方,以及國外的資料庫 Pubmed、GoPubmed、web of science、F1000、ResearchGate……,也會詳細描述通過哪些軟體,對文獻進行高質量的篩選,包括 NoteExpress、醫學文獻王、EndNote、Histcite……

文獻篩選方法種類:進行文獻篩選有很多的方法,我會在下面篇章中,詳細介紹,其中包括:

  • 影響因子
  • 互引:行業高引用
  • 核心期刊
  • 專家評價

中國知網高級檢索

以「高血壓」作為主題檢索,可以見到如下檢索頁面:

可以看到,共檢索出 271 205 篇文獻,面對如此繁多的文獻量,如何選取高質量的文獻?

接下來,我們通過以下兩種方式,對文獻進行初步篩選,從而選出優質高水平的文獻。

1. 被引篩選

被引:顧名思義,就是一篇文獻的被引數量。如果某篇文獻被引量高,那麼,可以說明這篇文獻被廣為所知,大家都認同的高質量文獻,也就是說,在相同主題檢索下,被引次數越多,文獻的質量也相對更高。

在上圖的檢索界面,我們可以發現就有「被引」的選項。

我們點擊「1. 被引」,就能對檢索的文獻進行被引次序的排列,而「2. 被引」則顯示了每篇文獻的被引數量,如下圖:

很快的,我們就能檢索出本主題中最高質量的文獻:「中國高血壓防治指南 2010」,其被引次數為:65 638,依次類推。

2. 互引分析

第一種「被引篩選」,其實還有很多的「漏洞」。首先,年代越久遠的文獻,因為多年的「被引」沉澱,會獲得很多的被引量,而越是近期的文獻,因為剛發表,即使文獻質量很高,也很難被人廣泛引用。

其次,即使是你的檢索式已經很精確,也會檢索出很多無關的文獻,如很多跨行專業的引用。例如檢索關於「高血壓」主題的文獻,可以發現,一篇文獻可能會被心內科專業的同行引用,也可能被統計專業,甚至是經濟學、農學專業的人士引用。

所以,單純的「被引」排序,也不夠精確),因此,接下來,我們就引入了下面這個概念:「互引」。

互引:從文字上說,就是相互引用。每篇文獻都會有很多參考文獻,那麼,多篇文獻互相引用的參考文獻,可以說是本行業各位專家共同認可的文獻(相當於同行推薦),從而避免了無關文獻的納入。

雖然我們常在知網上檢索文獻,然而,卻很少發現有這麼一個選項:「已選文獻分析」,接下來,我們就這方面進行探討。

選則你覺得高質量的文獻(可以是被引排序中的文獻),然後點擊已選文獻分析,網頁就會跳轉到「計量可視化分析」頁面,我們依次往下,可以看到:

上圖中的「指標分析」,是對納入的 20 篇文獻進行分析,發現,這 20 篇文獻共有 71 篇參考文獻(排除了共同引用的參考文獻),共被引數為 17 911 篇指標,而「總體趨勢分析」,可以看到整個「指標分析」根據年代、發文量的圖表。

其中,「藍點」為所選文獻,「綠點」為參考文獻,「橙點」為引證文獻(引證文獻是指引用本文的文獻)。選中一個點,就能看到當年被引的文獻發文量。

注意:引證文獻,是該論文發表之後被引用的次數,可以顯示出該論文發表後每年的被引次數多少。

如果你在進行計量可視化分析時選取了 1 篇文獻,那麼可以看到這篇文獻發表後被引每年量;

而如果你選取了上百篇文獻,這個時候,你就能看到你的研究整體趨勢了,從上圖中,我們可以發現,就「高血壓」這個主題我們選取的 20 篇文獻被引量(17911),每年都在往上走(橙色曲線)——最後兩個點是 2016 年的,因為我們之前說過,越是進的文獻,其被引次數越少(不是因為不重要,而是因為沒有歲月的沉澱)。

總體來說,我們研究的主題,整個發展趨勢還是不錯的。如果你研究的主題進行總體趨勢分析後,發現曲線下滑了好多年,這個時候,你就要考慮考慮時候還有繼續研究的意義了。比如「SARS」的研究曲線:

在 2003 年的時候到達了一個高峰,而後就急劇的下滑(這是有疾病爆發性,也是一過性,研究熱隨著疾病爆發的減少而下降)。這個時候,你再去研究相關研究,可能意義就不是很大了。

因此,可以說,「計量可視化分析」可以看一個領域的未來發展前景。

我們在「計量可視化分析」頁面繼續往下看,可以發現如下界面:

註:圖中的圈越大,說明被引的越多,圈與圈相互連接,則說明這兩篇文獻是相互引用的文獻。

從圖中,無門可以看到在圈中越是密集,圈越大的文獻,則是互引最多的文獻,也就是被同行認可最多的文獻。選中一個圈,可以顯示這篇論文的基本信息,雙擊可以跳轉到該論文的詳細信息界面。

綜上,可以先在網頁上對論文進行初步的質量篩選,選出你認可的高質量文獻,從而進一步進行深入閱讀。

接下去,還會講解如何通過軟體進行文獻的進行一步步篩選,想聽的請留言。


推薦閱讀:

獲取學術資源的一些渠道
Science:不怕熱的單原子
《詩》樂流傳版本簡述
耶律烏不呂說「三父異籍時亦易得。」是什麼意思?

TAG:文献 | 知网 | 筛选 |