如果你選修過中國科學技術大學羅昭鋒老師的《文獻管理與信息分析》,那么你一定不會對HistCite 感到陌生,這是一款非常強大的引文分析工具,可以快速繪制出某個研究領域的發展脈絡,快速鎖定某個研究方向的重要文獻和學術大牛,還可以找到某些具有開創性成果的無指定關鍵詞的論文。
如果說一次引用表示給你的文章投一票,那么並不是所有票都有效,只有相同領域文章的引用才能真正體現你在這個領域中的實力。所以在 Web of Science (以下簡稱 WOS)上按照被引次數倒序排列,越靠前不一定就越重要。還有一種情況,你發明了某種材料,但是后來名字變了,之后的文章使用的關鍵詞都是新名字,別人搜新名字的關鍵詞是搜不到你的開創性文章的,但是很顯然你的文章是非常重要的。通過 HistCite 可以直觀的看出這個研究領域的論文全部引用了你的文章,可以體現你的文章的重要性。
好了,下面開始使用這個工具。首先要了解一點,HistCite 這款軟件是 Thomson Reuters (湯森路透)公司開發的,和 WOS 是一家公司,所以 HistCite 只支持 WOS 數據庫,對於 Scopus 等數據庫則無能為力,不過 Github 上面有人寫了一個可以將 Scopus 導入 Histcite 進行分析的腳本——Scopus2Histcite,有興趣的同學可以去試試看。
2016年10月,湯森路透知識產權與科技業務被 Clarivate Analytics (科睿唯安)公司收購了,從此 WOS 也是歸該公司所有,因此導出的數據純文本也發生了些許變化,從而不能直接導入 HistCite 進行分析。不過別擔心,HistCite Pro 完全兼容新的文件格式!
打開WOS,注意數據庫要選擇核心合集(Core Collection)!
例如簡單檢索一下石墨烯在鋰離子電池負極中的應用:
檢索結果不是太多,可以全部導出,如果文獻太多的話,可以先按照被引頻次降序排列,只導出前2000篇就差不多了。
下面開始導出文獻信息,點擊頁面上的【保存至 Endnote Online】按鈕右邊的下拉按鈕,選擇【保存為其他文件格式】。
在彈出的菜單中,記錄數填寫1到500,因為每次最多只能導出500篇文獻,所以上面的2819篇文獻需要分成6次導出,后面導出的時候依次填寫501到1000、1001到1500等等。。。記錄內容選擇【全記錄與引用的參考文獻】,文件格式選擇【純文本】,然后點擊發送即可得到導出的 txt 文件,類似可以導出其他5個。
注意:含500個記錄的txt文檔一般是3M左右,如果你的只有幾百K,請仔細按照上面這張圖進行導出!!!
下面使用 HistCite 來分析這6個txt格式的引文數據文件。由於 HistCite 多年不更新,現在存在各種 Bug,比如直接打開 HistCite,一加載文件就報錯:No such file or directory。如果有多個文本文件,可以重復執行導入;注意,如果導入出現錯誤,將要導入文本文件開頭中的 ”FN Thomson Reuters Web of Science“替換成 “FN Thomson Reuters Web of Knowledge" 即可。
嘗試第二種方法。選中所有的 txt 文件,然后拖到 HistCite 的圖標上,放開鼠標,果然自動打開了軟件。
但是,事情好像並沒有那么簡單,又出現了一個報錯:Format Unknown。
在受到這么多折磨之后,我用 Python 開發了一個方便使用的腳步,於是一個以 HistCite 源程序為核心的精簡易用免安裝版本問世了,就叫 HistCite Pro 吧。
由於 HistCite 源程序只支持 Windows 系統,所以 Pro 版本也只能在 Windows 下使用!
你只需要下載 HistCite Pro 的壓縮包(下載鏈接見文末)並解壓(建議解壓到 C 盤或者 D 盤的根目錄下,保證路徑中不含中文),就可以直接用,不需要安裝,同時去掉了很多沒用的文件,大大縮小了軟件體積。對於從WOS上導出的txt數據文件,不用做任何修改,只要把全部的txt放到 TXT 文件夾里面,然后雙擊 main.exe 並輸入數字 1 即可一鍵完成加載,非常方便。(下面是整個操作過程的動圖,點擊播放)

如果輸入數字 1 發現沒有自動打開瀏覽器窗口,或者打開的是一個空白網頁,或者可以打開網頁之后顯示的條目數為0,首先檢查一下前面的導出操作沒有錯誤,然后看一下自己的 IE 瀏覽器能不能正常打開百度等網頁,如果 IE 瀏覽器有故障,可以參考這個鏈接進行修復。
如果還不行,那就是 HistCite 內核本身存在的設計缺陷(畢竟這么多年沒有官方更新了),在少部分電腦上會出現兼容性問題。所以我采用 Python 的多線程成功實現了Advanced 模式,基本可以解決絕大部分兼容性問題,即輸入數字 3。
注意:在該模式下,程序所在路徑中的所有文件夾和文件的命名都不能含有中文。
該模式啟動之后會自動打開兩個瀏覽器窗口,先打開默認的 IE 瀏覽器窗口(記為 A 窗口),一般顯示的 Records 數量為 0,然后 5 秒之后會調用系統默認瀏覽器(推薦安裝 Chrome 瀏覽器並設置為默認)打開另一個窗口(記為 B 窗口),一般在 B 窗口就可以正常進行數據的導入。等導入完成之后,你可以將 A 窗口關閉,在 B 窗口里面分析數據,或者刷新 A 窗口也是可以分析數據的。
好了,數據加載完畢,下面開始分析數據吧,點擊 Tools 菜單下的 Graph Maker。
在彈出的頁面上點擊 Make Graph 即可得到一張引文關系圖,包含了最有價值的前 30 篇文章的完整引文關系,這個數字 30 是可以自行修改的。
這張圖看起來不是很清楚,在左邊的Size選項中選擇 Full 模式,重新繪制一張高清圖,然后右擊圖片“另存為”一張圖片即可。
圖上有 30 個圓圈,每個圓圈表示一篇文獻,中間的數字是這篇文獻在數據庫中的序號。圓圈越大,表示被引用次數越多。不同圓圈之間有箭頭相連,箭頭表示文獻之間的引用關系。多數情況下,你會看到最上面有一個圓圈較大,並有很多箭頭指向這篇文章。那么這篇文章很可能就是這個領域的開山之作。
通過我繪制出的這張關系圖,我們發現標號為29、49、56、60的四個大圓圈非常顯眼,可見這四篇文獻的被引次數都是非常高的,我們對全部文獻進行按照 LCS 排序,發現前四位剛好就是這 4 篇文獻。
再回到那張圓圈箭頭關系圖,可見石墨烯在鋰離子電池負極材料中的應用研究主要起源於2008年(29號文獻),其通訊作者Honma來自日本,看來日本在石墨烯電池方面的研究開展得相當早。之后,在2010年,很多原創性的成功迸發而出,具有代表性的就是49、56、60、48號文獻,非常有趣的是,2010年諾貝爾物理學獎的獲獎項目剛好是石墨烯,其中的關聯顯而易見。之后的幾年,石墨烯在鋰離子電池負極方面的研究越來越多,方向約越來越細。
好了,前面提到HistCite可以找到某些具有開創性成果的無指定關鍵詞的論文,我們來看看是怎么辦到的。點擊頁面上的【Cited References】,然后就可以看到本地庫中的文獻參考的全部文獻信息,后面帶有加號的表示本地txt庫中沒有包含。如果然后按照 Recs 數排序,可以看到有幾篇 Recs 數很大的文獻並沒有在分析范圍之內,這些往往就是被遺漏的重要文獻。正常情況下點擊加號(+)后的 WOS 就可以自動通過 WOS 將文獻載入分析。
如果點擊之后網頁報錯,內容是:Routing Error。Error massage:cannot process request with unsupported DestLinkType:CitedLookup。
這是由於 WOS 地址解析錯誤,可以按照以下方法來解決。
首先在任何網頁瀏覽器中打開 Web of Science 網頁,點擊【被引參考文獻檢索】標簽(英文版是【Cited Reference Search】)。復制當前頁面的網址,后面要用。網址格式為:http://apps.webofknowledge.com/UA_CitedReferenceSearch_input.do?SID=******&product=UA&search_mode=CitedReferenceSearch,注意最后以 CitedReferenceSearch 結尾。
然后在 Histcite 工具欄 tools下拉菜單中選擇 Settings 點擊。
在彈出的對話框中,往下找到 WoS link 這一欄,默認選擇是 Universal setup,改選 Manual setup version 4,然后在 ISI web of knowledge 4 location URL 下面的框里粘貼剛才復制的網址,再點擊【Set】即可。
然后再點擊遺漏文獻后面加號(+)后的 WOS 就可以打開 WOS 並自動將文獻信息填進去,然后點擊【檢索】。
在搜索結果中找到所需要的文獻(一般被引次數最多的那個就是),點擊【完成檢索】即可顯示引用了該篇文獻的所有文獻,同樣可以導出 txt 加入 Histcite 進行分析。
同樣的,我們點擊 Histcite 頁面的【Authors】按鈕,可以找到本領域的一些大牛,具體的操作步驟讀者可以自己去摸索。
那么我們怎么把文獻記錄導出到Endnote呢?首先點擊菜單欄中【Tools】下的【Mark&Tag】選項,調出標記選擇工具欄。
下圖紅框內就是標記選擇工具欄。左邊欄用於指定選擇范圍,可以選擇當前列表中的全部文獻,也可以按照序號(#)、LCS、LCR等數值的區間來選擇文獻,還可以手動勾選需要的文獻。中間欄表示的是需要導出的信息范圍,可以只導出記錄本身,也可以選擇導出引用的文獻或者被引的文獻。右邊欄的【Mark】按鈕就是確認選擇按鈕。
所以,我們選擇好了需要導出的文獻記錄,點擊【Mark】按鈕。
然后,我們就會發現上面出現了一個新的標簽【Marks】,后面的數字就是我們選中的記錄條數,如果發現這個數字不正確,點擊【Mark】按鈕旁邊的【Unmark】來重新選擇。確認無誤之后,點擊圖示的【Marks】標簽鏈接,即可顯示全部被選的文獻記錄。
好的,下面依次點擊【File】、【Export】、【Records...】來導出選中的文獻記錄。
成功導出后得到一個 .hci 格式的文本文件,直接修改后綴為 txt。如果導出不成功,一般多嘗試幾次就可以。
好的,現在我們打開Endnote,依次點擊【File】、【Import】、【File...】按鈕。
在彈出的對話框中通過【Choose...】找到剛才的txt文件,【Import Option】選擇 Multi-Filter (Special),【Duplicates】選擇 Import All,然后點擊【Import】按鈕即可導入。
最后附上HistCite里面幾個重要的英文縮寫:
GCS(global citation score), 某一文獻在WOS數據庫中的總被引用次數。有些引用這篇參考文獻的文章可能和你的研究方向毫無關系,但GCS還是會把這個引用數據記錄下來。
LCS(local citation score),某一文獻在本地數據集中的被引用次數。因為你導入Histcite的文章都是和你檢索詞有關系的,可以認為這些文章是你的研究同行,因此如果某一篇文獻的LCS值很高,就意味着它是你研究領域內的重要文獻,很有可能是你領域內的開創性文章,注意LCS高的文獻和GCS高的文獻不一定是同一篇!
LCR(local cited references), 某一文獻引用本地數據集中參考文獻的數目。根據LCR值的排序,可以快速定位近期關注該領域的重要文獻,因為某一篇文獻引用當前數據集中的文獻數越多,說明它非常關注你檢索的這個研究方向的文獻,和你的研究肯定有相似或者可參考之處,可以從該文章中發現新動向。
CR(cited references), 某一文獻引用WOS數據庫中參考文獻的數目。這個值越高,說明這篇文獻很可能是綜述性文獻,可根據該值的排序,也可快速定位綜述文獻。
軟件下載連接:
1)https://pan.baidu.com/s/1hsIwJzQ?errno=0&errmsg=Auth%20Login%20Sucess&&bduss=&ssnerror=0&traceid=#list/path=%2F
2)https://www.lanzous.com/i2jvwba
文章來源: https://zhuanlan.zhihu.com/p/20902898;
參考連接:https://blog.csdn.net/qq_36607894/article/details/93868058