如何用VOSviewer分析CNKI數據?
學會了用VOSviewer分析Web of Science數據後,想不想知道如何用它分析中文文獻?本文用CNKI數據做樣例,一步步教你實現步驟。
疑問
自從寫了《如何快速梳理領域文獻》一文後,不少讀者留言或者來信問我一個問題:
如何可視化分析中文文獻呢?
我之前沒有用VOSviewer做過中文文獻的梳理,所以還真不知道VOSviewer是否有這個功能。
但是我在博士畢業論文里用Citespace分析過中文文獻,所以就用我最有把握的答案做了答覆。
不過,隨著問這個問題的人越來越多,我也來了興趣:VOSviewer到底能否分析中文文獻數據呢?
懷疑的原因,是因為之前在網上查資料時,看到的好像都是英文分析結果。而且VOSviewer的作者都是外國人,所以我不確認它對中文文獻是否友好。
於是,我決定驗證一下。
驗證的方法,不是直接拿軟體來嘗試,而是查文獻。
驗證
有句話,叫「在有魚的地方釣魚」,我覺得是至理名言。
如果有人用VOSviewer做過中文文獻分析,你覺得這樣的結果更可能在哪裡出現呢?
新聞?博客?……不,一定是科研論文,而且是中文論文里。
我們到CNKI資料庫里找找看。
在CNKI首頁,以「VOSviewer」作為主題詞檢索。獲得了以下結果。
看來將VOSviewer作為研究工具的論文還真不少呢。
我們從標題尋找其中更有可能使用中文文獻數據的論文,於是找到了這篇《2010年中國檔案學研究熱點的知識圖譜分析》。
看了摘要,確認該文使用中文期刊數據,分析工具為VOSviewer。
於是我們下載原文看看。
在文中顯著位置,我們看到了這幅圖。
這幅圖說明,VOSviewer不僅支持中文文獻分析,而且至少從2011年就支持了。
好了,我們的疑惑解決了——VOSviewer可以分析中文文獻數據。
自然地,下一個問題就是:
該怎麼做呢?
數據
第一步當然是收集數據。
我們繼續使用CNKI。這次我們以「圖書情報知識」(情報學領域核心期刊之一)作為「文獻來源」檢索詞搜索。
獲得的結果,有4700多條。我這裡連接網速不夠快,4700多條文獻記錄都下載下來,需要很久。咱們精鍊一下,只選擇2016年的數據。
2016年的記錄,一共有101條。我們每次50條,不斷翻頁,全部勾選。
勾選完畢後,選擇「導出/參考文獻」。
在屏幕的左側,我們可以看到不同的導出類型。
問題來了,該導出哪一種呢?
這時我們打開VOSviewer,瞄一眼,看VOSviewer可以接受哪些格式。
這裡我們看到了Web of Science, Scopus, PubMed, RIS等格式。
我們的目標,是取CNKI導出格式,與VOSviewer導入格式的交集。
結果令人很苦惱——交集為空。
到這裡,我大概知道為什麼這麼多讀者發問了。不少人可能在CNKI上做到了這一步,然後就不知道該怎麼辦了。
其實你不必焦慮。因為文獻記錄格式之間,是可以轉換的。
我們選擇其中的Endnote格式,導出。
根據提示,存儲導出的txt文件。
我們打開這個文本文件,看看內容。
經檢驗,數據完整導出。下面我們就要嘗試格式轉換了。
轉換
我們的目標,是把數據轉化為VOSviewer可以支持的格式類型。
我們打開Endnote。
從主菜單里,選擇「導入(Import)」。
在彈出的窗口裡,瀏覽並找到我們剛剛從CNKI導出的txt文件。
注意,此時不要直接導入文本文件,否則導入結果是空的。
我們需要調整一下選項。點擊文件瀏覽窗口左下角的「Option」。
點擊其中的第一項,可以看到許多選項。Endnote作為老牌的文獻管理工具,支持的數據格式很豐富。
選擇「Endnote Import」。這樣Endnote才知道,我們導入的,是Endnote自己的交換格式。
點擊確定後,你就能看到100餘篇文獻正確導入進來了。
我們在這裡對文獻做粗略篩選。略去「卷首語」和重複文章,同時略掉沒有作者的(一般是徵稿啟示等內容)文章。
篩選後的文獻選中,選擇「導出」(Export)。
Endnote會提示我們導出的選項。
我們把輸出的文件名設定為有意義的名稱。注意要把「Output Style」選擇為「RIS」格式。
如果你的菜單裡面沒有「RIS」格式,可以先選擇「Select another Style」。
然後你會看到許許多多的導出格式選項,下拉列表到「R」開頭的區域,找到「RIS」。
選擇後,「RIS」就被添加進來了。
默認導出文件擴展名是txt。我們將其修改為ris,以方便VOSviewer識別。
我們打開RIS文件看看內容:
可以看到,元數據都被保留,但是組織格式發生了變化。
至此,利用Endnote轉換文獻記錄格式環節順利完成。我們終於可以愉快地分析CNKI文獻了。
分析
在VOSviewer中選擇「Create」。會彈出以下對話框。我們選擇第二項。
然後我們需要選擇導入文獻的類型和位置。
點擊「RIS」標籤頁,利用文件選擇器,定位到剛剛Endnote導出的RIS文件上。
下面選擇分析類型,我們選擇作者共現(Co-authorship)分析。
因為文章篇數太少,我們不得不把閾值定低一些。
彈出的對話框里,我們可以依據實際情況,把某些記錄過濾掉。這裡我們選擇保持不變。
執行後,就能看到Co-authorship分析結果了。
我們放大結果圖,看看細節。
圖中中文顯示一切正常。
至此,咱們利用VOSviewer分析CNKI文獻記錄的演示完成。
小結
回顧一下,本文主要介紹了以下內容:
- 我們確認了VOSviewer不止可以分析英文文獻,也可以分析中文文獻;
- 驗證猜想,需要找證據。找證據的關鍵,是在最可能的地方著手搜索和挖掘;
- 文獻記錄的格式多種多樣,但是其間大多是可以轉換的。Endnote作為橋樑,可以幫我們把CNKI的導出結果轉換為VOSviewer需要的RIS格式。
討論
讀過本文後,你是否了解如何用VOSviewer分析中文文獻數據?你之前做中文文獻可視化分析時,用過不同的方法嗎?它們是否更有效和便捷呢?歡迎留言,把你的經驗分享給大家,我們一起交流討論。
這裡給你留個思考題:如果要做引文分析,CNKI的數據可以嗎?希望你能親自動手嘗試一下,把結果反饋給我。
如果你對我的文章感興趣,歡迎點贊,並且微信關注和置頂我的公眾號「玉樹芝蘭」(nkwangshuyi)。
如果本文可能對你身邊的親友有幫助,也歡迎你把本文通過微博或朋友圈分享給他們。讓他們一起參與到我們的討論中來。
推薦閱讀:
※亞瑟王、石中劍、梅林真的存在嗎?
※如何快速篩選到想要的核心文獻?
※獲取學術資源的一些渠道
※Science:不怕熱的單原子
※《詩》樂流傳版本簡述