
CiteSpace陳超美
在科研工作中,我們常常需要面對海量的文獻,如何在這些文獻當中找出值得精讀、細讀的關鍵文獻,挖掘學科前沿,找到研究熱點就成為了開展研究之前首先需要解決的問題。CiteSpace作為一款優秀的文獻計量學軟件,能夠將文獻之間的關系以科學知識圖譜的方式可視化的展現在操作者面前,既能幫助我們梳理過去的研究軌跡,也能使得我們對未來的研究前景有一個大概的認識。
CiteSpace 又翻譯為“引文空間”,是一款着眼於分析科學分析中蘊含的潛在知識,是在科學計量學、數據可視化背景下逐漸發展起來的引文可視化分析軟件。由於是通過可視化的手段來呈現科學知識的結構、規律和分布情況,因此也將通過此類方法分析得到的可視化圖形稱為“科學知識圖譜”。摘自 李傑.CiteSpace中文版指南
正如科學計量學界的權威專家劉則淵教授對CiteSpace知識圖譜形態的概括一樣,“一圖展春秋,一覽無余;一圖勝萬言,一目了然”。近年來,使用CiteSpace開展的研究、發表的論文呈現不斷上升的趨勢。根據中國知網的統計,2017年相關論文已經達到388篇;到2018年預測將達到423篇。

在如此多同質化的文章面前,我們應當如何做好自己的研究才能夠不落入俗套,進而脫穎而出呢?我認為,在深入的把握CiteSpace的原理的基礎上,熟稔相關操作背后的含義,對CiteSpace軟件的應用達到游刃有余,這樣才能知道自己的研究需要什么,做到“知己”。同時了解相關文章的研究套路,清晰他們的研究內容和研究思路,取其精華,規避其錯誤,做到“知彼”。下面根據我個人的一些學習的體會和實際使用的情況對CiteSpace使用過程來跟大家做一個基礎性的介紹。
一、CiteSpace的下載與界面介紹
訪問http://cluster.ischool.drexel.edu/~cchen/citespace/download/下載CiteSpace,一般下載最新版。當前(2018年10月14日)最新版為5.3.R4,新版本在原來版本的基礎上增加了引文級聯引用功能。
使用CiteSpace需要先安裝JAVA 8,安裝教程參考jdk 8下載和安裝步驟

下載完成后解壓,打開StartCiteSpace_Windows.bat。一般選擇英文。

進入下一個界面,提醒使用者在使用這個軟件開展研究的發表論文的時候,別忘了把軟件開發者的論文引用上,不同意就用不了,那我們當然選擇同意。

CiteSpace的功能區域很質朴,分為執行操作區、時間選擇區、文本處理功能區和網絡配置功能區等。在隨后的論述中,再對這些功能區進行逐一展開。

二、CiteSpace的數據來源與下載:分析的原料在哪里
使用CiteSpace分析某一主題的研究歷史與研究前沿,第一步就是要從文獻數據庫上下載到一定數量的文獻信息。外文文獻信息一般在web of science(WoS)上下載得到,中文文獻信息一般在中國知網(CNKI)上下載。CiteSpace是基於WoS的數據格式進行開發的,可以根據下載得到的數據進行合作網絡分析、共現分析和共被引分析,在非WoS數據庫下載得到的數據都需要先轉化為WoS的數據格式,根據相應數據庫的數據維度各有其相對應的適用范圍。就數據庫的深度看,外文數據庫我們一般使用WoS,中文數據庫一般使用CNKI。
另外,中文的文獻數據庫還有CSSCI數據庫、CSCD數據庫等,外文的文獻數據庫還包括Scopus數據庫、Derwent專利數據和其他專業領域的數據庫等,下載方法參考《CiteSpace:科技文本挖掘及可視化》第2講。

在數據檢索時,一般有兩種檢索策略,分別是:
- 按照關鍵詞檢索
- 按照期刊檢索
我們以按照關鍵詞檢索為例,說明如何從文獻數據庫中,下載得到我們所需要的文獻數據。
1、在WoS上下載數據
在WoS上下載數據,訪問WoS的官網http://apps.webofknowledge.com。操作的第一步是登錄,假如沒有賬號,需要先行注冊一個。沒有登錄的話,是無法下載數據的。

以關鍵詞“學習成果評價”為例,鍵入其英文“learning outcome assessment”,數據庫選擇“Web of Science核心合集”,檢索類型選擇“主題”,時間跨度選擇“所有年份”。我所在的學校購買到的數據庫是從1985年開始的,時間跨度可能對有些朋友而言不夠長。當前國內購買WoS數據庫跨度最長的地方是中科院文獻情報中心,是從20世紀初期就開始的,有需要的朋友可以到那里進行數據下載。

得到如下頁面。從頁面中可以看出,該主題詞下的索引結果有10054條。下一步,需要對檢索結果進行精煉。

文獻類型選擇“文章”,點擊精煉。得到的最終檢索結果為7050條,這些文獻數據使我們最終想要的。

隨后,滑到底部,將記錄改成每頁顯示50條。

回到頂部,按照下圖步驟,分別點擊“選擇頁面”,“添加到標記結果列表”,就完成了這一頁面的數據添加。最后點擊“下一頁”,循環這個過程。WoS最多支持500條數據保存一次。

在標記完500條數據后,選擇“保存為其他文件格式”。

隨后,記錄內容選擇“全紀錄與引用的參考文獻”,文件格式選擇“純文本”,點擊“發送”,就可以得到剛才我們標記過的500條文獻信息了。

下載得到的內容包括論文標題、作者、資助基金、關鍵詞、來源期刊、所屬領域、論文摘要、參考文獻等等。對余下文獻信息做相同的操作,即可以得到所需要的數據全集。

Tips:
- 關鍵詞的翻譯,例如“學習成果評價”,找出幾篇以“學習成果評價”為關鍵詞的引用率較高的文獻,中外比較類(例如比較教育學)的研究最好。參考其下的英文對照翻譯,綜合選擇即可以得到我們需要的英文關鍵詞。
- 查看相關數據時,最好時候Notepad++、sublimetext等編輯器。格式更加醒目、清晰。
2、在CNKI上下載數據
在CNKI上,同理,訪問www.cnki.net,鍵入檢索詞“學習成果評價”,每頁顯示選擇“50”,勾選“全部選中”按鈕,點擊到下一頁,同樣以500條數據為一次下載。

在選擇完畢后,點擊“導出/參考文獻”。

選擇Refworks,點擊“導出”,就完成了本次下載。

得到的數據維度比WoS得到的數據維度要少一下,僅包括作者、標題、來源期刊、關鍵詞、摘要等。對余下數據做同樣的操作,就可以得到中文的數據集。

在得到數據集后,需要將這些數據集轉化為CiteSpace可以識別、讀取的數據格式。參考如下tips即可完成轉換。
Tips:
- CiteSpace自帶有數據轉換的功能,但不太好用,容易出現一些問題。推薦下載使用格式轉換器。轉換器下載鏈接
- 轉換后會將原本集合在一個txt文件中的數據打散,生成一條數據一個txt的形式,txt文件過多會極大的降低了CiteSpace的運算速度。為了解決這個問題,打開命令行工具(cmd),輸入下面的代碼,將這些TXT合並成一個。 引自:將多個txt文件合並成一個