知識圖譜完整項目實戰(附源碼)(3)


一、前言

本文是《知識圖譜完整項目實戰(附源碼)》系列博文的第3篇:汽車知識圖譜系統架構設計,主要介紹汽車領域知識圖譜系統的總體架構設計和關鍵技術。

知識圖譜的學習是一個基礎到實戰,從入門到精通的一個逐漸深入的、漸進式的過程。在這個過程中,一個完整的項目,起到的作用往往是對過往所學全部知識的串聯和融合。只有經過一個完整項目的實踐,才能真正把所學的、離散的、點狀的知識點融合到一起,從而形成理論到實戰的轉變。基於這樣的一個原因考慮,結合自身工程實踐的過程,才有了這樣一個課程,希望能夠對渴望知識圖譜能力進階的人有所裨益。

二、正文

2.1 汽車知識圖譜總體設計

汽車知識圖譜的系統架構可以划分為五個層次:數據源、ETL知識抽取層、數據模型層、業務邏輯層、知識應用層。這里面層次的划分其實是在參考傳統的數據系統建設的思路。

2.2 汽車知識圖譜關鍵技術

知識圖譜的關鍵技術可以從知識的來源進行區分,包括知識獲取對應網絡爬蟲,ETL工具;知識存儲對應圖數據庫;知識圖譜可視化對應數據可視化分析工具等。

2.2.1 圖數據庫

Neo4j是圖數據庫領域的王者,連續多年在DB排行中處於第一,具有成熟的文檔和穩定的系統,同時包括開源版本和企業版本,是構建知識圖譜的首選。

Apache Jena是RDF和OWL的開發框架,同時提供了Fusike和TDB的數據訪問和存儲支持,是基於本體建模的最佳選擇。

2.2.2 Python爬蟲


python爬蟲框架中,最為成熟和完整的框架是scrapy,目前為止是基於pyton構建網絡爬蟲的最佳選擇。其工作流程和運行機制如下圖所示:

三、未完待續

本文是《知識圖譜完整項目實戰(附源碼)》系列博文的第3篇:汽車知識圖譜系統架構設計,主要介紹汽車領域知識圖譜系統的總體架構設計和關鍵技術。配套視頻內容已同步發布在網易雲課堂《知識圖譜完整項目實戰(附源碼)》,敬請關注。知識圖譜交流群:149933712。



免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM