如何用VOSviewer分析CNKI數據?

學會了用VOSviewer分析Web of Science數據後,想不想知道如何用它分析中文文獻?本文用CNKI數據做樣例,一步步教你實現步驟。

疑問

自從寫了《如何快速梳理領域文獻》一文後,不少讀者留言或者來信問我一個問題:

如何可視化分析中文文獻呢?

我之前沒有用VOSviewer做過中文文獻的梳理,所以還真不知道VOSviewer是否有這個功能。

但是我在博士畢業論文里用Citespace分析過中文文獻,所以就用我最有把握的答案做了答覆。

不過,隨著問這個問題的人越來越多,我也來了興趣:VOSviewer到底能否分析中文文獻數據呢?

懷疑的原因,是因為之前在網上查資料時,看到的好像都是英文分析結果。而且VOSviewer的作者都是外國人,所以我不確認它對中文文獻是否友好。

於是,我決定驗證一下。

驗證的方法,不是直接拿軟體來嘗試,而是查文獻。

驗證

有句話,叫「在有魚的地方釣魚」,我覺得是至理名言。

如果有人用VOSviewer做過中文文獻分析,你覺得這樣的結果更可能在哪裡出現呢?

新聞?博客?……不,一定是科研論文,而且是中文論文里。

我們到CNKI資料庫里找找看。

在CNKI首頁,以「VOSviewer」作為主題詞檢索。獲得了以下結果。

看來將VOSviewer作為研究工具的論文還真不少呢。

我們從標題尋找其中更有可能使用中文文獻數據的論文,於是找到了這篇《2010年中國檔案學研究熱點的知識圖譜分析》。

看了摘要,確認該文使用中文期刊數據,分析工具為VOSviewer。

於是我們下載原文看看。

在文中顯著位置,我們看到了這幅圖。

這幅圖說明,VOSviewer不僅支持中文文獻分析,而且至少從2011年就支持了。

好了,我們的疑惑解決了——VOSviewer可以分析中文文獻數據。

自然地,下一個問題就是:

該怎麼做呢?

數據

第一步當然是收集數據。

我們繼續使用CNKI。這次我們以「圖書情報知識」(情報學領域核心期刊之一)作為「文獻來源」檢索詞搜索。

獲得的結果,有4700多條。我這裡連接網速不夠快,4700多條文獻記錄都下載下來,需要很久。咱們精鍊一下,只選擇2016年的數據。

2016年的記錄,一共有101條。我們每次50條,不斷翻頁,全部勾選。

勾選完畢後,選擇「導出/參考文獻」。

在屏幕的左側,我們可以看到不同的導出類型。

問題來了,該導出哪一種呢?

這時我們打開VOSviewer,瞄一眼,看VOSviewer可以接受哪些格式。

這裡我們看到了Web of Science, Scopus, PubMed, RIS等格式。

我們的目標,是取CNKI導出格式,與VOSviewer導入格式的交集。

結果令人很苦惱——交集為空。

到這裡,我大概知道為什麼這麼多讀者發問了。不少人可能在CNKI上做到了這一步,然後就不知道該怎麼辦了。

其實你不必焦慮。因為文獻記錄格式之間,是可以轉換的。

我們選擇其中的Endnote格式,導出。

根據提示,存儲導出的txt文件。

我們打開這個文本文件,看看內容。

經檢驗,數據完整導出。下面我們就要嘗試格式轉換了。

轉換

我們的目標,是把數據轉化為VOSviewer可以支持的格式類型。

我們打開Endnote。

從主菜單里,選擇「導入(Import)」。

在彈出的窗口裡,瀏覽並找到我們剛剛從CNKI導出的txt文件。

注意,此時不要直接導入文本文件,否則導入結果是空的

我們需要調整一下選項。點擊文件瀏覽窗口左下角的「Option」。

點擊其中的第一項,可以看到許多選項。Endnote作為老牌的文獻管理工具,支持的數據格式很豐富。

選擇「Endnote Import」。這樣Endnote才知道,我們導入的,是Endnote自己的交換格式。

點擊確定後,你就能看到100餘篇文獻正確導入進來了。

我們在這裡對文獻做粗略篩選。略去「卷首語」和重複文章,同時略掉沒有作者的(一般是徵稿啟示等內容)文章。

篩選後的文獻選中,選擇「導出」(Export)。

Endnote會提示我們導出的選項。

我們把輸出的文件名設定為有意義的名稱。注意要把「Output Style」選擇為「RIS」格式。

如果你的菜單裡面沒有「RIS」格式,可以先選擇「Select another Style」。

然後你會看到許許多多的導出格式選項,下拉列表到「R」開頭的區域,找到「RIS」。

選擇後,「RIS」就被添加進來了。

默認導出文件擴展名是txt。我們將其修改為ris,以方便VOSviewer識別。

我們打開RIS文件看看內容:

可以看到,元數據都被保留,但是組織格式發生了變化。

至此,利用Endnote轉換文獻記錄格式環節順利完成。我們終於可以愉快地分析CNKI文獻了。

分析

在VOSviewer中選擇「Create」。會彈出以下對話框。我們選擇第二項。

然後我們需要選擇導入文獻的類型和位置。

點擊「RIS」標籤頁,利用文件選擇器,定位到剛剛Endnote導出的RIS文件上。

下面選擇分析類型,我們選擇作者共現(Co-authorship)分析。

因為文章篇數太少,我們不得不把閾值定低一些。

彈出的對話框里,我們可以依據實際情況,把某些記錄過濾掉。這裡我們選擇保持不變。

執行後,就能看到Co-authorship分析結果了。

我們放大結果圖,看看細節。

圖中中文顯示一切正常。

至此,咱們利用VOSviewer分析CNKI文獻記錄的演示完成。

小結

回顧一下,本文主要介紹了以下內容:

  1. 我們確認了VOSviewer不止可以分析英文文獻,也可以分析中文文獻;
  2. 驗證猜想,需要找證據。找證據的關鍵,是在最可能的地方著手搜索和挖掘;
  3. 文獻記錄的格式多種多樣,但是其間大多是可以轉換的。Endnote作為橋樑,可以幫我們把CNKI的導出結果轉換為VOSviewer需要的RIS格式。

討論

讀過本文後,你是否了解如何用VOSviewer分析中文文獻數據?你之前做中文文獻可視化分析時,用過不同的方法嗎?它們是否更有效和便捷呢?歡迎留言,把你的經驗分享給大家,我們一起交流討論。

這裡給你留個思考題:如果要做引文分析,CNKI的數據可以嗎?希望你能親自動手嘗試一下,把結果反饋給我。

如果你對我的文章感興趣,歡迎點贊,並且微信關注和置頂我的公眾號「玉樹芝蘭」(nkwangshuyi)。

如果本文可能對你身邊的親友有幫助,也歡迎你把本文通過微博或朋友圈分享給他們。讓他們一起參與到我們的討論中來。


推薦閱讀:

亞瑟王、石中劍、梅林真的存在嗎?
如何快速篩選到想要的核心文獻?
獲取學術資源的一些渠道
Science:不怕熱的單原子
《詩》樂流傳版本簡述

TAG:文献 | 数据分析 | 数据可视化 |