學術研究的一般過程(Ⅱ)——畫竹,必先得成竹於胸中

文獻調研的重要性在這裡就不贅述了,該文章主要解決兩個問題:

1.如何了解學術前沿研究

2.如何快速入門新的研究領域

1.如何了解學術前沿研究

1.1 working paper & Preprint

要了解學術的前沿研究,除了多參加學術會議、多跟圈子裡的人交流以外,一個很重要的途徑是閱讀五花八門的working paper。 Wikipedia 上對我們通常所指的working paper是這樣定義的:

A preliminary scientific or technical paper. Often, authors will release working papers to share ideas about a topic or to elicit feedback before submitting to a peer reviewed conference or academic journal. Working papers are often the basis for related works, and may in themselves be cited by peer-review papers. They may be considered as grey literature.

通常文章的審核、修改和發表周期很長,國外更是如此。為了不被別人搶先,當然也是為了及時分享自己的科研成果,許多作者在文章正式發表之前,會先將論文以working paper的形式發表出來供大家參考和交流,因此持續關注working paper可以快速了解各細分領域研究的最新進展。雖說working paper不是正式發表的,但也經過了嚴格的修改和審議,所以大部分WP的質量都很高,而且常常與最終發表的文章保持一致。

說到working paper,就繞不開 Preprint 預印本:

預印本(Preprint)也稱未定稿本。在學術出版領域,預印本是指尚未在需要同行評審的科學期刊上出版的科學文獻的草稿。

作者在寫作完成後,可能在出版之前將草稿預先公開讓大家閱讀並提出更改建議,並在稍後提交學術期刊進行出版。 學術期刊一般會讓選定的業內人士對投稿的文章做同行評審後才發表,但是某些雜誌機構也會將未經專家評審的未定稿本發表在該雜誌/機構的網站上。

從概念上看, Preprint 與 working paper 類似,不知道二者的區別是否在經同行審議上,但是對一般的讀者來說,一視同仁就好。

1.1.1 NBER working paper

美國全國經濟研究所(英語:National Bureau of Economic Research 簡寫:NBER)是一個美國私營、非營利的機構, 同時亦是美國最大的經濟學研究組織。目的是研究經濟的運作,進行實證的經濟學研究。三十一個美國諾貝爾經濟學獎得獎者中有十六位曾是美國全國經濟研究所的研究員。

能上NBER的working paper少說也是有三把刷子的。要養成每日一刷的好習慣。

1.1.2 arXiv.org

最重要的 Preprint 開放存取網站,以理工科文獻為主,沒有經濟學,但是關注量化金融和統計的童鞋可以關注。

1.1.3 SSRN

Social Science Research Network,是一個和arXiv對應的社科版 Preprint 網站。本該以共享為理念的它被Elsevier收購了。不過依然可看。

1.1.4 SocArXiv

SSRN 被Elsevier收購以後,為了抵制學術壟斷,憤怒的學者們模仿arXiv建立這個對應的社科版開放存取網站。

1.1.5 IDEAS

號稱 the largest bibliographic database dedicated to Economics and available freely on the Internet。適合按照作者持續追蹤最新研究進展。

1.1.6 EconPapers

號稱 EconPapers provides access to RePEc, the worlds largest collection of on-line Economics working papers, journal articles and software。跟IDEAS差不多。

1.2 其他適合關注的雜誌和網站

1.2.1 Jeconpers

由AEA發布(American Economic Association),內容淺顯,觀點新穎。

1.2.2 The Economist - World News, Politics, Economics, Business & Finance

經濟學人,這個沒什麼好說的,學經濟的人都知道。

1.2.3 關注各學術大牛和學術新星的個人主頁

國外學者有一個習慣,就是建立屬於個人的主頁,一般這種個人主頁上會有最新的工作進展,所有的論文,詳細的code,一些idea,聯繫方式等等,而且打理的井井有條,經常能有意外收穫,可謂良心。

2.如何快速入門新研究領域

快速入門意味著要實現以下幾點:

1.定位開創性文獻、重要歷史文獻、重要前沿文獻

2.發現該領域的奠基人、重要推進者、活躍的新星

要實現這兩點可能的困難:

1.關鍵詞模糊

2.檢索出的文獻太多

3.檢索出的文獻太少

沒錯,文獻太多太少都是問題。不過一般來說,文獻太少的問題更大,因為這意味著我們可能按照錯誤的關鍵詞檢索了相關內容,或者漏掉了其他相關的關鍵詞。文獻太多會讓我們無法快速理清該研究的發展脈絡與推進方向。下文的方法都是在解決這三個問題。

2.1 利用學術資源

師兄弟、導師、在校老師都是重要的學術資源,問一問總沒有壞處,常常我們拍腦袋想出來的新東西早就有一些研究,只是叫法不同,但本質上是一樣的。導師在自己了解的領域,無論是耕耘程度還是他的人脈與見聞,都遠勝學生,常常導師推薦幾篇論文就能省去很多麻煩,也會讓自己少走很多彎路。

2.2 學術會議、前沿論壇

別人做好綜述讓你聽,開不開心。

2.3 閱讀別人做好的文獻綜述

建議只用於定位關鍵詞,不用細讀,避免陷入別人的邏輯中。

2.4 技術流,劃重點

用兩個工具來實現:WOS+HistCite

2.4.1 利用WOS導出完整的文獻信息

(1)在wos的核心庫中檢索相關信息

(2)利用左側的篩選功能篩選結果

(3)按照「被引頻次」降序排列

(4)選擇保存為其他文件格式

(5)選擇全記錄、純文本,因為我們要用文章中的引用信息。最多一次可以保存500條,所以文獻很多的話需要分批保存。分批發送到本地後WOS的任務就完成了。

(6)按照「發布日期」降序排列,大致瀏覽後選擇下載最近兩三年的即可,重複(4)(5),目的是在分析中涵蓋最新的研究成果。

2.4.2 利用HistCite分析導出的結果

(1)下載HistCite pro。良心軟體,去這裡下載,還有詳細介紹和使用指南,我這裡主要是做了簡化,略去了技術上的細節。

(2)將之前導出的結果全部放入TXT文件夾中

(3)打開main.exe,等待,出現詢問後,輸入YES,回車

(4)會跳出一個這樣的網站。注意別把之前的黑色窗口關了,那是主程序。

(5)畫文獻關係圖。選擇Tools,Graph maker。Limit表示展示的文獻數量,不用全部分析,選擇前30%就可以。size表示圖示的大小,選擇Full,不然看不清楚。

(這裡直接使用了Tsing的示例圖,因為看起來很清楚)

這個圖是這樣看的:

從上往下表示時間順序,降序

連線表示引用關係

連線的密集程度表示引用數量

圓圈的大小也表示引用數量

解決問題1:

可以看出,通常都存在一篇 頂端文獻 ,毫無疑問,這是開創性的成果,後續的研究通常都要引用它,這篇文章是這個領域裡的奠基作,必讀。

後續會有幾個明顯的大圓圈,和這篇奠基作存在引用關係,這就是重要的後續研究,這些大圓圈通常會比較平行,彼此之間不一定存在引用關係,說明他們在這項研究中比較獨立,分別代表了不同的流派或者推進方向,彼此之間的理論觀點可能會存在衝突。這種衝突需要我們著重討論。

偶爾會有一兩篇非常孤立的文章,沒有或者少有後續引用,在圖片上位於邊緣地帶,說明他們的觀點沒有人follow。可能是坑,也可能是有待挖掘的寶庫。

通過這個圖也可以看到研究的推進,令人感慨,常常一個流派經歷一段時間的沒落後,突然有大牛跟進,一下就盤活了整個理論,帶動了眾多後續的研究。

這個圖上我們還能看出很多東西。有的文章和之前的大多數文章都有連線,說明它很可能是一篇綜述

一些很新的文獻和幾個流派有較為平均的引用關係,說明他可能是探討性質的研究,意在驗證幾個理論的有效性。一些新文獻會著重引用某個理論流派的文獻,說明他是這個觀點的追隨者。

一般最近的那幾個大圈就代表了這個領域內研究的主要推進方向,也許我們就需要選擇其中的一個follow。

不過新文獻因為缺少引用,很難判斷其重要程度,所以追蹤前沿還是靠老師同學推薦新星學者,以及自己追蹤working paper。

圖示下方會給出具體的文獻信息,按照圓圈裡的編號找就可以。

(6)點擊Authors,定位關鍵學者。 解決問題2

需要了解的是:

LCS : local citation score 本地引用得分,表示被 本地文獻 引用的次數

GCS: global citation score 全局引用得分,表示被 全局文獻 引用的次數

Resc: 發表數量

因為有的文獻會被非本領域內的研究引用,比如經濟學引用心理學的研究成果,這就屬於全局文獻引用,通常我們不會很關注這個。我們更關心的是,這個作者(或者論文)在這個研究領域內部被引用了多少次,這才具有足夠的說服力。所以一般我們都看LCS而較少參考GCS。

發表數量是重要的參考,但不是唯一的參考,畢竟有些大牛就寫了一篇開山之作,然後上千引用。

LCR : local cited reference 引用本地文獻的數量

CR : cited reference 引用文獻的數量

這個通常用來篩選綜述性文章。

(7)點擊Journals,定位受眾期刊

如果某個期刊登了很多這個領域的文章,那在投稿的時候可以著重考慮,因為期刊在研究內容上也是有選擇的,某一類型的文章會更受編輯的青睞。

(8)點擊Cited References,查漏補缺。 解決遺漏關鍵詞的問題。

綠色的加號表示,這些是被本地文獻庫(我們下載的文獻)大量引用,卻沒有包含在庫里的文獻。這些文獻就是我們在篩選過程中遺漏的文獻。產生這種情況的原因是:

1.開創性成果還沒有形成統一的特指名詞,導致多個關鍵詞指代同一概念。

2.研究思路的問題

比如我們考慮研究主題:奢侈品消費帶給個體效用上滿足。另一個研究思路是,消費與幸福感的關係,相對收入與幸福感的關係。相關性很強,但已經是另一個層面上的東西了。不過我們會遺漏,廣大的研究者並不會。這一步操作給了我們查漏補缺的機會。

不過這個過程很痛苦……標記功能似乎不好用,笨方法是把遺漏的文獻逐篇在WOS上搜索,並「添加到標記結果列表」,然後導出成純文本或者其他格式。

(9)利用Make tags功能,標記導出我們需要的題錄,並通過文獻管理軟體讀取。

Select records with可以按照某種類型的值的範圍來自動篩選。

Select records checked on this page 手動選擇。

一次只能選擇一種屬性,range可以限定值的範圍,選好之後點擊右邊的Mark就可以把文獻加入到Marks裡邊。可以把Marks理解成獨立的檔案庫,重複操作並不會添加重複的文獻進去。

(該圖片來自Tsing)

這一步會比較麻煩,因為我們需要導出這樣幾類文獻:

高LCS文獻

高LCR與部分高CR文獻

選好了Marks後選擇file>export>records,然後將後綴hci手動改為TXT。然後就可以通過其他文獻管理軟體讀取這個TXT了,所有導出的題錄會添加到文獻庫中。


推薦閱讀:

一鍵下載所有中英文付費文獻

TAG:學術寫作 | 文獻檢索 |