文獻引文分析利器 HistCite 詳細使用教程(精簡易用免安裝版本 HistCite Pro 首發頁面)

申明:本文是 HistCite Pro 唯一官方發布頁面,從本文鏈接下載的軟體絕無病毒!如果遇到殺毒軟體的誤報,請放心添加信任!請不要從其他下載站下載本程序!

如果你選修過中國科學技術大學羅昭鋒老師的《文獻管理與信息分析》,那麼你一定不會對HistCite 感到陌生,這是一款非常強大的引文分析工具,可以快速繪製出某個研究領域的發展脈絡,快速鎖定某個研究方向的重要文獻和學術大牛,還可以找到某些具有開創性成果的無指定關鍵詞的論文。

如果說一次引用表示給你的文章投一票,那麼並不是所有票都有效,只有相同領域文章的引用才能真正體現你在這個領域中的實力。所以在 Web of Science (以下簡稱 WOS)上按照被引次數倒序排列,越靠前不一定就越重要。還有一種情況,你發明了某種材料,但是後來名字變了,之後的文章使用的關鍵詞都是新名字,別人搜新名字的關鍵詞是搜不到你的開創性文章的,但是很顯然你的文章是非常重要的。通過 HistCite 可以直觀的看出這個研究領域的論文全部引用了你的文章,可以體現你的文章的重要性。

好了,下面開始使用這個工具。首先要了解一點,HistCite 這款軟體是 Thomson Reuters (湯森路透)公司開發的,和 WOS 是一家公司,所以 HistCite 只支持 WOS 資料庫,對於 Scopus 等資料庫則無能為力,不過 Github 上面有人寫了一個可以將 Scopus 導入 Histcite 進行分析的腳本——Scopus2Histcite,有興趣的同學可以去試試看。

2016年10月,湯森路透知識產權與科技業務被 Clarivate Analytics (科睿唯安)公司收購了,從此 WOS 也是歸該公司所有,因此導出的數據純文本也發生了些許變化,從而不能直接導入 HistCite 進行分析。不過別擔心,HistCite Pro 完全兼容新的文件格式!

打開WOS,注意資料庫要選擇核心合集(Core Collection)!

例如簡單檢索一下石墨烯在鋰離子電池負極中的應用:

檢索結果不是太多,可以全部導出,如果文獻太多的話,可以先按照被引頻次降序排列,只導出前2000篇就差不多了。

下面開始導出文獻信息,點擊頁面上的【保存至 Endnote Online】按鈕右邊的下拉按鈕,選擇【保存為其他文件格式】。

在彈出的菜單中,記錄數填寫1到500,因為每次最多只能導出500篇文獻,所以上面的2819篇文獻需要分成6次導出,後面導出的時候依次填寫501到1000、1001到1500等等。。。記錄內容選擇【全記錄與引用的參考文獻】,文件格式選擇【純文本】,然後點擊發送即可得到導出的 txt 文件,類似可以導出其他5個。

注意:含500個記錄的txt文檔一般是3M左右,如果你的只有幾百K,請仔細按照上面這張圖進行導出!!!

下面使用 HistCite 來分析這6個txt格式的引文數據文件。由於 HistCite 多年不更新,現在存在各種 Bug,比如直接打開 HistCite,一載入文件就報錯:No such file or directory。對於這種情況,你可以選擇在 C 盤根目錄下新建 fakepath 文件夾,然後將全部的 txt 文檔複製到裡面,再打開 HistCite 來進行載入,但是仍然會遇到下面 Format Unknown 的問題。

嘗試第二種方法。選中所有的 txt 文件,然後拖到 HistCite 的圖標上,放開滑鼠,果然自動打開了軟體。

但是,事情好像並沒有那麼簡單,又出現了一個報錯:Format Unknown

最後,在羅老師的指引下,我將每個 txt 文件的第一行中的 Science 改成了 Knowledge

然後再將 txt 文件拖放到 HistCite 圖標上面打開,終於成功載入了!

可以看到2819篇文獻信息全部載入進來了。

在受到這麼多折磨之後,我用 Python 開發了一個方便使用的腳步,於是一個以 HistCite 源程序為核心的精簡易用免安裝版本問世了,就叫 HistCite Pro 吧。

由於 HistCite 源程序只支持 Windows 系統,所以 Pro 版本也只能在 Windows 下使用!

你只需要下載 HistCite Pro 的壓縮包(下載鏈接見文末)並解壓(建議解壓到 C 盤或者 D 盤的根目錄下,保證路徑中不含中文),就可以直接用,不需要安裝,同時去掉了很多沒用的文件,大大縮小了軟體體積。對於從WOS上導出的txt數據文件,不用做任何修改,只要把全部的txt放到 TXT 文件夾裡面,然後雙擊 main.exe 即可一鍵完成載入,非常方便。

好了,數據載入完畢,下面開始分析數據吧,點擊 Tools 菜單下的 Graph Maker

在彈出的頁面上點擊 Make Graph 即可得到一張引文關係圖,包含了最有價值的前 30 篇文章的完整引文關係。

這張圖看起來不是很清楚,在左邊的Size選項中選擇 Full 模式,重新繪製一張高清圖,然後右擊圖片「另存為」一張圖片即可。

圖上有 30 個圓圈,每個圓圈表示一篇文獻,中間的數字是這篇文獻在資料庫中的序號。圓圈越大,表示被引用次數越多。不同圓圈之間有箭頭相連,箭頭表示文獻之間的引用關係。多數情況下,你會看到最上面有一個圓圈較大,並有很多箭頭指向這篇文章。那麼這篇文章很可能就是這個領域的開山之作

通過我繪製出的這張關係圖,我們發現標號為29、49、56、60的四個大圓圈非常顯眼,可見這四篇文獻的被引次數都是非常高的,我們對全部文獻進行按照 LCS 排序,發現前四位剛好就是這 4 篇文獻。

再回到那張圓圈箭頭關係圖,可見石墨烯在鋰離子電池負極材料中的應用研究主要起源於2008年(29號文獻),其通訊作者Honma來自日本,看來日本在石墨烯電池方面的研究開展得相當早。之後,在2010年,很多原創性的成功迸發而出,具有代表性的就是49、56、60、48號文獻,非常有趣的是,2010年諾貝爾物理學獎的獲獎項目剛好是石墨烯,其中的關聯顯而易見。之後的幾年,石墨烯在鋰離子電池負極方面的研究越來越多,方向約越來越細。

好了,前面提到HistCite可以找到某些具有開創性成果的無指定關鍵詞的論文,我們來看看是怎麼辦到的。點擊頁面上的【Cited References】,然後就可以看到本地庫中文獻參考的全部文獻信息,後面帶有加號的表示本地txt庫中沒有包含,這些往往就是被遺漏的重要文獻

同樣的,我們點擊上面的【Authors】按鈕,可以找到本領域的一些大牛,具體的操作步驟讀者可以自己去摸索。

那麼我們怎麼把文獻記錄導出到Endnote呢?首先點擊菜單欄中【Tools】下的【Mark&Tag】選項,調出標記選擇工具欄。

下圖紅框內就是標記選擇工具欄。左邊欄用於指定選擇範圍,可以選擇當前列表中的全部文獻,也可以按照序號(#)、LCS、LCR等數值的區間來選擇文獻,還可以手動勾選需要的文獻。中間欄表示的是需要導出的信息範圍,可以只導出記錄本身,也可以選擇導出引用的文獻或者被引的文獻。右邊欄的【Mark】按鈕就是確認選擇按鈕。

所以,我們選擇好了需要導出的文獻記錄,點擊【Mark】按鈕

然後,我們就會發現上面出現了一個新的標籤【Marks】,後面的數字就是我們選中的記錄條數,如果發現這個數字不正確,點擊【Mark】按鈕旁邊的【Unmark】來重新選擇。確認無誤之後,點擊圖示的【Marks】標籤鏈接,即可顯示全部被選的文獻記錄。

好的,下面依次點擊【File】、【Export】、【Records...】來導出選中的文獻記錄。

成功導出後得到一個 .hci 格式的文本文件,直接修改後綴為 txt。如果導出不成功,一般多嘗試幾次就可以。

好的,現在我們打開Endnote,依次點擊【File】、【Import】、【File...】按鈕。

在彈出的對話框中通過【Choose...】找到剛才的txt文件,【Import Option】選擇 Multi-Filter (Special),【Duplicates】選擇 Import All,然後點擊【Import】按鈕即可導入。

評論中沈曦同學提到了將 HistCite 選好的文獻導入到 Noteexpress 軟體里的方法,具體操作是在導入時將過濾器選擇為 web of science。

最後附上HistCite裡面幾個重要的英文縮寫(感謝Dingledodies同學):

GCS(global citation score), 某一文獻在WOS資料庫中的總被引用次數。有些引用這篇參考文獻的文章可能和你的研究方向毫無關係,但GCS還是會把這個引用數據記錄下來。

LCS(local citation score),某一文獻在本地數據集中的被引用次數。因為你導入Histcite的文章都是和你檢索詞有關係的,可以認為這些文章是你的研究同行,因此如果某一篇文獻的LCS值很高,就意味著它是你研究領域內的重要文獻,很有可能是你領域內的開創性文章,注意LCS高的文獻和GCS高的文獻不一定是同一篇!

LCR(local cited references), 某一文獻引用本地數據集中參考文獻的數目。根據LCR值的排序,可以快速定位近期關注該領域的重要文獻,因為某一篇文獻引用當前數據集中的文獻數越多,說明它非常關注你檢索的這個研究方向的文獻,和你的研究肯定有相似或者可參考之處,可以從該文章中發現新動向。

CR(cited references), 某一文獻引用WOS資料庫中參考文獻的數目。這個值越高,說明這篇文獻很可能是綜述性文獻,可根據該值的排序,也可快速定位綜述文獻。


【2016年5月16日更新】

首先給每一位用戶朋友真誠地說聲謝謝!同時感謝羅老師的大力推廣!

不過,也有少數用戶反饋了這個軟體存在的問題:HistCite可以啟動,但是不會自動打開瀏覽器窗口,或者打開的是一個空白窗口,或者可以打開窗口但是顯示的條目數為0,即沒有成功導入數據

這個問題的根源,其實是HistCite本身存在的設計缺陷(畢竟這麼多年沒有更新了),在少部分電腦上會出現導入數據不成功或者打不開窗口的情況。所以我研究了另外一種導入數據的方法,並採用Python的多線程成功實現了ADV模式,基本可以解決絕大部分兼容性問題。

如果你的電腦不存在上述兼容性問題,你不用在乎這個 ADV 模式,直接輸入YES即可完成數據的讀取。如果你的電腦出現了上述導入不成功的問題,你就可以輸入ADV回車之後會讀取 txt 文件,然後自動啟動 HistCite 內核。

HistCite 啟動之後會自動打開一個IE內核的瀏覽器窗口(記為 A 窗口),而這個窗口顯示我們導入的 Records 數量為0,即沒有成功導入數據。所以在 ADV 模式下,HistCite Pro 會自動調用系統默認瀏覽器在 5 秒後再打開一個窗口(記為B窗口)進行數據的導入,等導入完成之後,你可以將 A 窗口關閉,在 B 窗口裡面分析數據,或者按 F5 鍵刷新 A 窗口也是可以分析數據的。

注意:在ADV模式下,程序所在路徑中的所有文件夾和文件的命名都不能含有中文


【2016年5月18日更新】

評論中部分人反映在使用過程中遇到問題,很多都是由於自己操作不當導致的,要麼是資料庫沒有選擇【核心合集】,要麼是導出txt的時候沒有選擇【全記錄與引用的參考文獻】,如果還是導出不成功,請使用【ADV】模式。

所以請大家使用之前仔細閱讀上面的說明,而不是把時間浪費在無意義的錯誤之中。如果沒有時間看這篇文章,也可以看看評論,有沒有發現你一樣的問題,提問的時候盡量描述清楚你遇到的問題是什麼,而不是一上來就抱怨這個抱怨那個,這也是每一個知乎人最基本的素養吧。

希望大家使用順利!祝各位科研成功!


【2016年6月4日更新】

首先感謝小眾軟體的推薦!也感謝廣大用戶的信任,目前 HistCite Pro 的網盤下載和保存次數已經突破1500,這還不包括本地QQ群的共享以及備用下載源的下載次數。根據反饋信息,目前軟體用戶的覆蓋範圍除了中國的合肥、上海、北京、天津、香港、澳門、杭州、南京、廣州、重慶、武漢、西安、大連、廈門、深圳、青島、成都、昆明、蘭州、蕪湖、洛陽、長沙、瀋陽、蘇州、無錫、哈爾濱、濟南、福州、長春、太原、東莞、嘉興、淮南、烏魯木齊、呼和浩特、唐山、徐州、貴陽、秦皇島、溫州、淄博、煙台、寧波、贛州、鐵嶺、汕頭、湛江、荊州、日照、威海、阿壩藏族羌族自治州、南通、舟山、泰安、常德、濱州、滁州、綿陽、張掖、保定、渭南、四平、清遠、焦作、惠州、咸寧、漳州、南寧、鎮江、濰坊、商洛、江門等地,還有美國、英國、法國、德國、加拿大、日本、韓國、新加坡、澳大利亞、荷蘭、瑞典、丹麥、愛爾蘭等國。

鑒於很多使用者詢問怎麼把 HistCite 中的數據導到 Endnote 中,我在上文中補充了詳細的使用教程。如果遇到使用問題,請先逐字逐句閱讀上文,或者在搜索引擎中查找答案,依然解決不了的歡迎在下方留言,反饋時請詳細描述遇到的問題是什麼。


【2016年12月13日更新】

最近的科研任務非常重,也沒怎麼上知乎了,希望大家見諒。前幾天看到羅昭鋒老師通過支付寶給我打賞了,非常開心!我看了一下網盤裡面的下載記錄,目前已經非常高了,而且有許多網友留下了贊,謝謝你們的肯定!


【2017年10月15日更新】

首先感謝在支付寶平台和知乎平台上打賞支持的各位朋友!

目前為止,百度網盤中 HistCite Pro 的下載次數和保存次數總和已經超過一萬次!感謝廣大用戶的信任!特別感謝美國、俄羅斯、加拿大、英國、德國、新加坡、法國、日本、韓國、澳大利亞、愛爾蘭、荷蘭、瑞典、丹麥、泰國、印度尼西亞、挪威、香港、澳門、台灣等地區用戶的支持!

最近也看到一些網站(例如 360doc)在沒有經過我允許的前提下複製轉載了本文的部分或者全部內容,更有甚者說成是自己的成果,還有人對內容進行了胡亂修改,看到自己辛辛苦苦總結的東西被修改得一塌糊塗,真心很氣憤!因此,如果您想要轉載本文,請務必和我取得聯繫,並在顯眼處貼出本頁面的鏈接:zhuanlan.zhihu.com/p/20,感謝您在版權保護方面做出的努力!

之前看到 360 個人圖書館網站的一個用戶 「薄荷饃饃」 整篇轉載了本文(鏈接),於是我向網站提出舉報,結果郵件被駁回,還要求我提供一大堆的身份證明以及填寫各種表格,這太沒道理了!

於是一氣之下,我通過各種檢索分析找到了這個用戶的聯繫方式,最後與她取得聯繫,成功將其轉載的內容設置為僅她本人可見。

另外,還有不少的下載站將 HistCite Pro 壓縮包進行二次加工再供網友下載,這大大降低了用戶體驗,甚至有些無良下載站上還放置了很多的病毒軟體誤導用戶下載!所以如果您是下載站的管理員的話,懇請您考慮採用以下兩種方案之一:

1. 如果您的網站支持的話,直接將頁面上的下載鏈接全部跳轉到官方網盤鏈接pan.baidu.com/s/1hsIwJz),因為 HistCite Pro 以後可能會不定期升級,到時候老版本不一定可以正常工作。為了保證貴站軟體的最新性,跳轉到官方網盤下載是最好的選擇,這樣不僅不會影響網路流量,還可以節省您的網路帶寬。具體可以參考121下載站的做法:121down.com/soft/softvi

2. 如果您的站點 CMS 有限制,必須使用壓縮包的話,那就直接將百度網盤的地址寫到一個 txt 文檔裡面,然後做成壓縮包供大家下載即可。具體可以參考 UCBUG 遊戲網的做法:ucbug.com/soft/77090.ht


? 感謝以下支付寶賬戶的打賞支持 ? (支付寶二維碼位於文末網盤下載鏈接中)

2017.12.12 *影婕(bru***@163.com) 6.66元

2017.12.08 *孟廷(cmt***@sina.com) 6.66元

2017.12.03 *誠(130******51) 6.66元

2017.11.30 *喆(183******59) 6.66元

2017.11.30 *碩(x03***@126.com) 6.66元

2017.11.17 *慧(132******28) 6.66元

2017.11.12 *文(wan***@gmail.com) 6.66元

2017.10.24 *靜(182******08) 6.66元

2017.10.14 *琴紅(189******39) 6.66元

2017.10.12 *榕彬(352***@qq.com) 6.66元

2017.10.08 *佳浩(xuj***@pku.edu.cn) 6.66元

2017.10.07 *奔(der***@hotmail.com) 6.66元

2017.10.04 *弘(136******88) 6.66元

2017.10.03 *軍(489***@qq.com) 6.66元

2017.09.26 *運川(182******82) 6.66元

2017.09.10 *岩(zou***@gmail.com) 6.66元

2017.09.09 *明珍(583***@qq.com) 6.66元

2017.09.08 *柏(138***@163.com) 6.66元

2017.08.26 *景亮(luj***@gmail.com) 6.66元

2017.08.24 *博(wb2***@163.com) 6.66元

2017.08.15 *怡萱(ros***@gmail.com) 6.66元

2017.08.14 *輝(189******67) 6.66元

2017.08.10 *天麒(105***@sina.com) 6.66元

2017.08.07 *旻睿(187******33) 6.66元

2017.07.30 盼盼(155******21) 6.66元

2017.07.17 行書(gum***@qq.com) 6.66元

2017.06.28 穎(yan***@sina.com) 6.66元

2017.06.27 wavej(151******60) 6.66元

2017.06.23 Rhaplanca(lil***@live.cn) 6.66元

2017.06.21 彬(130******17) 6.66元

2017.06.09 瑋(182******59) 6.66元

2017.06.05 湖子(zha***@163.com) 6.66元

2017.06.04 斯佳(188******90) 6.66元

2017.06.02 rrerr(rre***@163.com) 6.66元

2017.05.22 亂了浮生(188******19) 6.66元

2017.05.12 酒瓶(186******29) 6.66元

2017.05.08 志強(188******80) 6.66元

2017.05.08 見龍在田(928***@qq.com) 6.66元

2017.04.13 炎炎(152****1661) 6.66元

2017.04.07 鑫(130****8661) 6.66元

2017.04.06 苗哥(798***@qq.com) 6.66元

2017.04.04 如夢(158****4621) 6.66元

2017.04.04 軍徽(186****7217) 6.66元

2017.04.01 志立(abc***@gmail.com) 6.66元

2017.03.27 儒元(yan***@163.com) 6.66元

2017.03.20 林興(139****5245) 6.66元

2017.03.18 翁澤斌(wen***@hotmail.com) 6.66元

2017.03.16 天意(138****7451) 6.66元

2017.03.03 正泰(188****8200) 6.66元

2017.03.01 琳(158****5856) 6.66元

2017.02.25 凌瀚(182****3801) 6.66元

2017.02.20 4thfleet(152****0749) 6.66元

2017.02.16 豎彎鉤兒(186****8109) 6.66元

2017.02.09 若心相續(ffh***@sina.com) 6.66元

2017.02.03 一休(yix***@eyou.com) 6.66元

2017.01.12 達(137****0659) 6.66元

2017.01.11 聖之(849***@qq.com) 6.66元

2017.01.11 Alicedong(185****3039) 6.66元

2017.01.10 奉若(159****8556) 6.66元

2016.12.28 偉(627***@qq.com) 6.66元

2016.12.06 羅昭鋒(smi***@ustc.edu) 5.00元

2016.12.02 bluer(996***@qq.com) 5.00元

2016.12.01 你是我的小姐姐么(466***@qq.com) 5.00元

2016.10.18 鵬(188****8198) 5.00元

2016.10.16 偉(lw_***@163.com) 5.00元

2016.08.25 wenyangapple(134****2199) 10.00元

2016.08.20 跳跳魚(150****2586) 5.00元

2016.08.12 憶聞(819***@qq.com) 10.00元

2016.06.25 xmwh(183***3334) 2.33元


HistCite Pro 網盤下載鏈接:pan.baidu.com/s/1hsIwJz

推薦閱讀:

OnlineJudge 2.0發布
爬蟲帶你逛知乎(下篇)
10min手寫(一):伺服器內存監控系統
為什麼 x in range(1000000000000001) 的執行速度這麼快

TAG:Python | 科研 | 文献检索 |