課題簡介:
“自動化學科創新思想與科學方法研究”課題,編號2009IM020300。 項目旨在對影響國內自動化領域發展的知識要素(包括 人物、機構、研究對象等)進行系統分析,形成知識體系,構建知識服務網絡平台,提供知識服務,促進知識創新。
項目涉及文獻情報分析與研究、知識關聯與服務等層面,但是在底層數據獲取的方面需要依賴於文本挖掘技術。
資源簡介:
論文:
PPT:
數據專區:http://www.datatang.com/member/5878
以下算法在論文中都有提到,
人名消歧和機構名稱歸一http://download.csdn.net/detail/finallyliuyu/5491655
科技術語或者說是關鍵詞的聚類算法:http://download.csdn.net/detail/finallyliuyu/5491665
知識族譜形成算法:http://download.csdn.net/detail/finallyliuyu/5491675
以上三個算法,寫的比較亂,也沒有時間進行優化了,有需要的自己費勁看一下吧。大致的框架是main函數調用DataBaseManagement類,再進行算法的調用。
文本分類程序代碼:http://www.datatang.com/data/13483 這個放在了數據堂已經有一定的下載量了。