文獻調研攻略進階版,學會Follow領域最新進展

文獻調研攻略進階版,學會Follow領域最新進展

來自專欄 喵大俠的生物學

本文主要內容的思維導圖:

文獻調研的技能樹主要包含三個部分,第一,如何找到你想找到的關鍵文獻;第二,如何效率地閱讀文獻;第三,如何管理文獻和記錄文獻閱讀的心得。

這就涉及到兩個關鍵的概念,即引文資料庫、全文資料庫:

1. 我們通常使用的WOS、pubmed等屬於引文資料庫,這些資料庫中僅包含文獻的標題、作者信息、出版物信息、摘要、參考文獻以及關鍵詞等,不包含文獻的全文,這一類資料庫常用於文獻檢索,即從引文資料庫中找到我們感興趣的文獻;

2. 全文資料庫指的是期刊的資料庫,它通常是需要付費獲取的,一些科研機構和圖書館會購買文獻出版集團的全文資料庫,以供自己的用戶使用——對於一些開放獲取的期刊,我們也可以在PMC資料庫中找到想要的文獻全文;

從資料庫中檢索感興趣的文獻並下載,屬於文獻的「調」,即從資料庫中把文獻調取到你的電腦上或者瀏覽器中。而文獻的「研」,即是瀏覽或閱讀文獻相關信息的過程。

Part 1 :從WOS等文獻檢索引擎中檢索文獻

  • WOS是我最常用的資料庫,它的優點是文獻的檢索結果更全面而不失嚴謹,缺點資料庫的更新不夠及時,同時還有一些瑕疵;
  • Pubmed 的資料庫更新較快,但是其高級檢索並不是非常好用;
  • 谷歌學術的檢索結果最全,但是其包含的信息比較駁雜;
  • CNKI幾乎是檢索中文文獻唯一的選擇;
  • GeenMedical可以將文獻按影響因子排序,還可以直接下載全文,但是高級檢索沒有那麼方便。

此處以WOS為例:

Wos這個資料庫需要購買,從各大高校和研究所的圖書館可以進入:

界面是這個樣子的:

圖片中有一些關鍵的部位,比如:

l WOS的一些其他資料庫,比如查看期刊影響因子的JCR;

l 不同的引文資料庫,通常我們選擇Web of Science核心合集;

l 三種檢索方式,其中高級檢索是較為重要的;

l 基本檢索的檢索項,比如標題、作者、出版物等;

l 檢索的時間跨度,某些時候我們會需要限定近幾年的最新研究;

在引文資料庫中選擇Web of Science核心合集,然後使用基本檢索,可以添加各種各樣的檢索詞,比如下圖:

我們輸入地錢的拉丁文名Marchantia polymorpha作為標題檢索項的內容,這是因為要避免在文章中提及它的一些文獻干擾我們的檢索結果,當然,為了檢索到更全面的結果,你也可以將其設置為主題;

隨後我們檢索Transform有關的文獻,是為了調研地錢轉化相關的研究;

最後,因為Takayuki Kohchi是這個領域有名的科學家,所以我們檢索他所做的研究,注意WOS對作者的姓名格式要求非常嚴格;

檢索結果如下:

這裡可以發現,由於檢索詞設置的問題,檢索到的結果較少,假如我們對關鍵詞Transform進行一下改變,變為Genetic檢索關於地錢的遺傳學研究:

可以看出Takayuki Kohchi對於地錢遺傳學研究的貢獻是較為突出的,我們可以針對這些文章的出版日期,被引用頻次,相關性等進行排序,在論文信息方面,可以看到標題、作者、出版物以及右側的被引頻次信息;

可以計算出,Takayuki Kohchi在這個領域的研究共被引用了236次,即有236項研究是基於他的工作來進行的,由此可見他對這個領域的突出貢獻。

此處點擊被引頻次的數字,可以查看究竟有哪些文獻引用了這篇文章。

這是基本檢索,那麼,當我們想檢索Takayuki

Kohchi所有發表在Cell、Plant Cell、Plant Cell and physiology上面的文章時,應該怎麼辦呢?

顯然,我們無法通過Takayuki Kohchi AND Cell AND Plant Cell AND Plant Cell and physiology這樣的檢索式來檢索,因為沒有一篇文獻是同時發表在Cell、Plant Cell、Plant

Cell and physiology三個期刊上的。

此時,就需要用到高級檢索了。

首先進入高級檢索的界面:

請關注右側紅框中的內容,這基本上代表了高級檢索的規則:

那麼,如題,我們輸入AU= Takayuki Kohchi,然後再輸入AU=Kohchi T;

在頁面的下方你會看到如下內容:

我們可以發現,WOS對於人名的格式要求,同時,還可以發現這位作者一共發表了112篇學術論文,當然——包含同名的情況,此時我們應該通過研究機構OG來進行限定。

再輸入出版物信息:SO=(Cell OR Plant Cell OR Plant Cell and physiology),注意此時使用的是OR邏輯連詞以及英文括弧,這代表我們將檢索所有發表在Cell 、 Plant Cell和Plant

Cell and physiology 這三個期刊上的研究。

結果如下:

通過右邊的組配檢索式,我們可以獲取題目要求的——Takayuki Kohchi所有發表在Cell、Plant Cell、Plant Cell and physiology上面的文章。

所以答案是8篇,點擊數字8即可查看這8篇文獻的具體內容。

同理,我們還可以檢測合成生物學領域所有發表在Science、Nature和Cell等期刊上的文章,在實際應用中,我們通常會直接檢索某個領域所有發表在一區期刊上的綜述

那麼讓我們來嘗試一下,檢索合成生物學領域所有的一區文章。

首先創建檢索式:TS=Synthetic biology;

然後,根據中科院JCR分區,輸入生物科學領域所有的一區期刊,創建檢索式:

如圖所示,用AND連片語培兩個檢索式:

得到了6411個結果,可是我們顯然不能在短時間內讀完6411篇文章以了解這個領域,因此我們需要對其進行篩選。

打開檢索結果,可以發現在左下方可以精鍊檢索結果。

第一篇文獻很有趣,這篇文章講述了分層式動態調控手段在大腸桿菌代謝工程之中的應用,可見這篇文章是一篇很重要的研究大腸桿菌代謝工程的文章,如果你了解過我的其他專欄文章,那你一定知道青蒿素的生物合成曾經有一階段是在大腸桿菌中進行的,可以說大腸桿菌是合成生物學的一個模式底盤。

這麼重要的文章被引用了0次,是因為它是最近才發表的,準確的說是一周以前。

引用這篇文章的文獻最快也要一個月以後才會出現在資料庫裡面,所以它再重磅再厲害,現在也是0引用的。

因此你會發現,即使文章很好,引用數也不一定高,因此,一定要找最近的研究,而不是拿一篇很老的綜述和最新的剛發表的綜述來比較引用數。

那麼我們將檢索結果精鍊為綜述

WOS愚蠢的設計在於,它無法精鍊發表於當前年份的文章,也就是說,在時間精鍊的選項中我只能選擇2017年的,因此我們將其按時間排序,依次閱讀標題和摘要,找到你感興趣的研究領域。

雖說後續的篩選會比較麻煩,但至少你找到了所有合成生物學相關的一區文章;

那麼,從這裡你就可以進入下一步,文獻檢索結果的分析;

Part 2 :文獻檢索結果的分析

在這裡還是以WOS為例,我們使用的是與其搭配的Histcite程序進行引文分析。

本次檢索的是在Web of science索引中的合成生物學領域一區期刊文章,結果如下:

從Web of science索引和從所有資料庫中檢索出來的結果是不一樣的,這可能與某些重複結果有關,一般情況下以從Web of science索引下檢出的結果為準;

打開檢索結果:

在網頁上可以進行一些簡單的排序和精鍊,也可以使用右側的分析檢索結果

那麼,如何進行Histcite引文分析呢?

簡單地說,Histcite引文分析就是分析你的檢索式下的文章的相互引用情況,也就是通過檢索式確定研究領域和文章層次,再通過本領域內文獻的互引情況來確定本領域的重量級研究和綜述——被本領域內文獻引用較多的才是真正的權威文章;

流程如下:

第一步,導出你的檢索結果;

先選擇保存為其他文件格式;

隨後限定記錄數和記錄內容以及文件格式,注意一次最多導出500條記錄;

點擊發送後會自動下載一個TXT文檔(最好使用谷歌瀏覽器),這個文檔就是你導出的檢索結果記錄,依次進行直到導出全部記錄或者依據相關性排序導出相關性比較高的前一部分結果;

從下載目錄中找到這些文檔;

第二步,對檢索結果進行分析:

Hsitcite是個腳本程序,向你展現的是一個文件夾:

將檢索結果拷貝到TXT文件夾下,替代原有的文件;

隨後點擊main運行:

輸入YES或ADV(兼容模式),運行;

可以在瀏覽器地址欄裡面輸入127.0.0.1,也可以等IE彈出窗口:

界面是這樣的:

Histcite提供的功能很多,下面為大家介紹主要的功能:

l 更多排序方式:

如圖,可以按照發表日期、作者、期刊、領域內引用量、總引用量、引用領域內文獻量、總引用的參考文獻數來進行排序,其中LCS是最常用的排序方式,也是最主要的衡量文獻重要性的指標。

上圖為按LCS領域內引用量排序的結果;

上圖為按GCS總引用量排序的結果:

可以看出,最典型的,總引用量排第一的用gRNA引導Cas9的人類基因組編輯的文章顯然不是合成生物學領域內最重要的文獻——即使它在基因編輯領域可謂炙手可熱;

按照LCS排序的結果就相對更貼近合成生物學領域,諸如排名第一的這篇綜述。

l 引用圖譜繪製:

點這裡,進入繪圖界面:

引文作圖可以更好地找出本領域的最近綜述、開山之作等標誌性節點。

在這裡注意藍色的文獻序號,可以對應著尋找目標文獻;

此處很多參數可調,請注意及自行發掘。

l 期刊與作者分析:

分析期刊的目的是檢索這個領域有那些期刊比較受歡迎,分析作者的目的是尋找本領域大牛,當然,還有很多其他的分析選項。

讓我們先來分析作者:

這裡面有幾個熟悉的名字,keasling,青蒿素代謝工程領域的大牛;

再來分析期刊:

此處點開每一欄後面的數字可以查看發表在這個期刊上的所有文章,比如點開核算研究的那一欄:

可以看到,元件發掘、DNA裝配、DNA合成在合成生物學中還是佔了很大比重的,這些方面的很多重要研究都發表在了這本期刊上。

Part 3 :文獻的下載(當你沒有資料庫許可權的時候)

相信上科大的同學們可能不會遇到這樣的問題,但是當大家在家中度假時如果想看一篇文獻,或許需要用到一些下載文獻的網站,除了上面說的GeenMedical外,還可以使用Sci-hub以及Gen-lib。

Sci-Hub和Gen-Lib一對難兄難弟,被研究者們所喜愛,被各大資本主義出版集團所打壓,搞得Sci-hub不停地更換域名,好像最近sci-hub.tw還可以使用。

記住要用文獻的DOI獲取全文,界面是這樣的:

你看的沒錯,SCI-HUB就是為了打破學術壟斷而出現的,可謂是應運而生。它誕生於一名俄羅斯女孩之手,目前這名俄羅斯女孩正面臨著數個出版商的起訴。

Gen-lib是電子書盜版網站,可以在這裡檢索一些專著的PDF,當然我知道你很大概率是不會看的,不過相信你有一天會用到這個網站。

檢索界面十分佛系

繼續佛系

詳細信息界面,注意紅框中是下載的相關網頁。

看到上方的單詞了嗎,GET IT!

Part 4 :文獻的閱讀

以上是文獻的「調」。

前面說了,下載到全文之後,就是文獻的「研」;

通常,建議通過這麼兩種方式來閱讀英文材料:

1.

谷歌瀏覽器應用商店裡面的谷歌翻譯插件,可以順滑地取詞翻譯,十分方便,主要用於在線版網頁上讀文獻;

2.

PDF在手機上搭配多看閱讀+歐路詞典,或者在電腦上搭配2345看圖王+Golden dictionary或有道詞典

這些翻譯插件的效果如下(如果達不到這種效果,那一定是你的打開方式不對):

谷歌詞典取詞插件需要自己在設置裡面調成自動彈出;

多看閱讀自帶詞典插件,但也可以配合歐路詞典複製取詞。

除了有道詞典,給大家推薦的APP或者軟體都是無廣告的清涼版本,如果你下到的是有廣告的,那你可能是從某些奇怪的應用寶上面下載的,去官網下載即可。

PDF閱讀器有很多,2345看圖王只是其中的一種,如果你有更好的無廣告的PDF閱讀器,可以向我推薦,萬分感謝。

Golden dictionary是自行下載詞典文件的,我用的是劍橋詞典,諸位可以自己下載一些漢英詞典之類的。

以上程序、軟體、APP的獲取,大家可以自己百度,如果實在有找不到的在評論區問我我會想辦法的;

如圖所示,谷歌翻譯插件的選項界面裡面,可以設置成直接彈出;

Part 5 :檢索式跟蹤:

檢索式跟蹤常用於跟進本領域最新的研究進展,是文獻檢索的必備技能。

在WOS、Pubmed等資料庫中都可以進行檢索式檢索式的跟蹤,下面以WOS為例:

我們可以進行以下兩種形式的跟蹤,第一是對某些檢索式的跟蹤,第二是對某篇文獻被引的跟蹤,比如你可以跟蹤Part 2 中查到的領域內的權威綜述;

讓我們回到Part 2 的檢索結果:

點擊保存歷史/創建跟蹤:

登陸Wos,隨後在彈出的窗口中填入一系列信息,就可以靜等每天(周/月)的郵件通知了~

Cas9編輯人類基因組的研究還是很重要的,讓我們來跟蹤都有那些文獻引用它吧!

登陸後點擊創建跟蹤即可立即創建:

填寫要發送往的電子郵件地址即可。

Part 6 :文獻的管理

在進行文獻管理時,主要有以下三個方面的需求:

l 與課題組其他人共享關鍵文獻;

l 從研究思路上進行分類管理並可以保存文獻閱讀的筆記;

l 生成論文的題注;

基於以上需求,推薦使用Trello和Mendeley綜合使用以管理文獻;

這兩個工具的使用方法可以便捷地在知乎等社區查到詳盡的攻略,在這裡不再贅述,主要為大家展示我的使用方法:

l 使用列表和標籤作為橫縱二維管理系列文獻:

這是我管理合成生物學相關文獻的看板:

1-很多研究都屬於一個小主題的,因此可以放到一個卡片下;

2-標籤可以標識很多不同類型的研究以及對自己的參考價值,Trello默認的顯示方式是不顯示標籤的名稱的,可以通過點擊卡片上標籤的方法展開標籤,如下圖:

3-可以添加一些Powerup功能,比如卡片老化;

l 課題組共享文獻的看板:

這個是我們團隊的新文獻資訊看板,採用的是同一領域不同角度的方式;

這個是原先的看板,採用的是每個列表不同領域的方式;

具體的使用方式各有長處,新看板比較專精生物製藥領域,老看板凡是有趣的研究都進行了收錄,相同的特點都是列表和標籤二維管理文獻,列表可以設置成綜述、技術建立、重要研究等,標籤則是細分的研究領域。

如果某個成員對某篇文獻感興趣,可以將自己拖拽到卡片下,在下一次組會上做彙報;

其他成員們還可以對卡片進行評論、點贊、上傳文獻筆記附件等;

比較遺憾的是,目前還沒有互動十分良好的範例給大家展示,我們團隊目前只有本科生,大家上課都比較忙,尚缺少積極活躍的參與者。

l 使用Mendeley管理寫論文引用的文獻:

Mendeley的常規操作;

拖入PDF,它可以自動為你生成一系列相關信息(聯網情況下);

Mendeley的一大優勢是它可以當作PDF閱讀器來使用,搭配有道詞典食用更佳;

附錄:

一些可以被你的谷歌瀏覽器收藏的網站:

資料檢索及獲取類:

WOS:apps.webofknowledge.com

Pubmed:ncbi.nlm.nih.gov/pubmed

GreenMedical:geenmedical.com/search

Gen-lib:gen.lib.rus.ec/

Sci-hub:sci-hub.tw/

KEGG資料庫(代謝相關):genome.jp/kegg/

Protocol Online :protocol-online.org/

NCBI的核苷酸資料庫:ncbi.nlm.nih.gov/nuccor

密碼子偏好性庫:kazusa.or.jp/codon/

CNKI:epub.cnki.net/kns/defau

工具類:

Blast:blast.ncbi.nlm.nih.gov/

Primer design:ncbi.nlm.nih.gov/tools/

ORFfinder:ncbi.nlm.nih.gov/orffin

我的科研工具箱共享鏈接(Onedrive雲盤):

1drv.ms/f/s!AkerGNi5mtF

如有疑問,歡迎致信Wanglin1102@outlook.com。

推薦閱讀:

人死亡後大腦仍可活動10分鐘:呈現深度睡眠腦電波
Progress in Ni-Zn Battery
知乎1662萬次瀏覽,4個高票回答,本篇真切講述了實驗室那些最危險的經歷。
啥?原來樹木年輪是這樣子!漲姿勢
科學與零假設 --- 光,豌豆和引力波走進一個酒吧...

TAG:自然科學 | 科研 | 文獻檢索 |