知識圖譜的前景與挑戰


  如果未來的智能機器擁有一個大腦,知識圖譜就是這個大腦中的知識庫,對於大數據智能具有重要意義,將對自然語言處理、信息檢索和人工智能等領域產生深遠影響。

  現在以商業搜索引擎公司為首的互聯網巨頭已經意識到知識圖譜的戰略意義,紛紛投入重兵布局知識圖譜,並對搜索引擎形態日益產生重要的影響。同時,我們也強烈地感受到,知識圖譜還處於發展初期,大多數商業知識圖譜的應用場景非常有限,例如搜狗知立方更多聚焦在娛樂和健康等領域。根據各搜索引擎公司提供的報告來看,為了保證知識圖譜的准確率,仍然需要在知識圖譜構建過程中采用較多的人工干預。

  可以看到,在未來的一段時間內,知識圖譜將是大數據智能的前沿研究問題,有很多重要的開放性問題亟待學術界和產業界協力解決。我們認為,未來知識圖譜研究有以下幾個重要挑戰。

  1. 知識類型與表示。知識圖譜主要采用(實體1,關系,實體2)三元組的形式來表示知識,這種方法可以較好的表示更多事實性知識。然而,人類知識類型豐富多樣,面對很多復雜知識,三元組就束手無策了。例如,人們的購物記錄信息,新聞事件等,包含大量實體及其之間的復雜關系,更不用說人類大量的涉及主觀感受、主觀情感和模糊的知識了。有很多學者針對不同場景設計了不同的知識表示方法。知識表示是知識圖譜構建與應用的基礎,如何合理設計表示方案,更好地涵蓋人類不同類型的知識,是知識圖譜的重要研究問題。最近認知領域關於人類知識類型的探索(Tenenbaum,et al. 2011)也許會對知識表示研究有一定啟發作用。

  2. 知識獲取。如何從互聯網大數據萃取知識,是構建知識圖譜的重要問題。目前已經提出各種知識獲取方案,並已經成功抽取出大量有用的知識。但在抽取知識的准確率、准確率和效率方面,都仍不盡如人意,有極大的提升空間。

  3. 知識融合。從不同來源數據中抽取的知識可能存在大量噪聲和冗余,或者使用了不同的語言。如何將這些知識有機融合起來,建立更大規模的知識圖譜,是實現大數據智能的必由之路。

  4. 知識應用。目前大規模知識圖譜的應用場景和方式比較有限,如何有效實現知識圖譜的應用,利用知識圖譜實現深度知識推理,提高大規模知識圖譜計算效率,需要人們不斷銳意發掘用戶需求,探索更重要的應用場景,提出新的應用算法。這既需要豐富的知識圖譜技術積累,也需要對人類需求的敏銳感知,找到合適的應用之道。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM