碩士學位論文 面向自動化學科中文期刊論文的文本挖掘系統


課題簡介:

     “自動化學科創新思想與科學方法研究”課題,編號2009IM020300。 項目旨在對影響國內自動化領域發展的知識要素(包括 人物、機構、研究對象等)進行系統分析,形成知識體系,構建知識服務網絡平台,提供知識服務,促進知識創新。

     項目涉及文獻情報分析與研究、知識關聯與服務等層面,但是在底層數據獲取的方面需要依賴於文本挖掘技術。

 

資源簡介:

論文:

面向自動化學科中文期刊論文的文本挖掘系統

PPT:

面向自動化學科中文期刊論文的文本挖掘系統PPT

 

數據專區:http://www.datatang.com/member/5878

以下算法在論文中都有提到,

人名消歧和機構名稱歸一http://download.csdn.net/detail/finallyliuyu/5491655

科技術語或者說是關鍵詞的聚類算法:http://download.csdn.net/detail/finallyliuyu/5491665

知識族譜形成算法:http://download.csdn.net/detail/finallyliuyu/5491675

以上三個算法,寫的比較亂,也沒有時間進行優化了,有需要的自己費勁看一下吧。大致的框架是main函數調用DataBaseManagement類,再進行算法的調用。

文本分類程序代碼:http://www.datatang.com/data/13483 這個放在了數據堂已經有一定的下載量了。

 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM