NLPIR智能KGB知識圖譜引擎可視化數據挖掘


  隨着經濟、科技的快速發展,人們遇到的數據信息量越來越大,這就促使了數據挖掘技術的興起。隨着數據挖掘技術的推廣,一些因素逐漸成為制約數據挖掘深入的關鍵問題。而挖掘過程的不可見性是其中一個主要方面。

  數據挖掘可視化技術可理解為處理計算或實測數據的一種方法,它以圖形、圖像來描述物理現象,使看不見的現象成為可見,為研究、使用人員提供前所未有的機會來理解大量數據所蘊含的豐富內容,發現通常數值信息發現不了的現象。

  數據挖掘可視化技術是隨着數據挖掘技術和信息可視化技術的發展而產生的,它有效地把人的感知能力和領域知識應用到數據挖掘的過程中。它以刻畫結構和顯示數據的功能性,以及人類感知模式、例 外、傾向和關系的能力為基礎,用可視化來加強數據挖掘處理。數據挖掘是從大量的歷史數據中抽取 出潛在的、有價值的知識過程。可視化就是把數據、信息和知識轉化為可視的表示形式的過程。它為人類與計算機這兩個信息處理系統之間提供了一個接口。使用有效的可視化技術,可以快速高效地與大量數據打交道,以發現其中隱藏的特征、關系、模式和趨勢等,可以引導出新的預見和更高效的決策。

  同時,數據可視化在不同的粒度或抽象層面上,將不同的屬性或維度相結合,觀察數據庫或數據倉庫的數據。首先將數據進行可視化映射,把數據表轉換為可視化結構(結合了空間基、標記和圖形屬性的結構),然后通過定義位置、縮放比例、裁減等圖形參數創建可視化結構的視圖,並通過用戶的交互動作來控制這些變換的參數,例如把視圖約束到特定的數據范圍,或者改變變換的屬性等。最常見的數據可視化技術包括柱狀圖、餅狀圖、散點圖、三維立方體、曲線、數據分布圖表等。

  北京理工大學大數據搜索與挖掘實驗室張華平主任研發的NLPIR大數據語義智能分析技術是對語法、詞法和語義的綜合應用。NLPIR大數據語義智能分析平台平台是根據中文數據挖掘的綜合需求,融合了網絡精准采集、自然語言理解、文本挖掘和語義搜索的研究成果,並針對互聯網內容處理的全技術鏈條的共享開發平台。

  其中KGB(Knowledge Graph Builder)知識圖譜引擎是我們自主研發的知識圖譜構建與推理引擎,基於漢語詞法分析的基礎上,采用KGB語法實現了實時高效的知識生成,可以從非結構化文本中抽取各類知識,並實現了從表格中抽取指定的內容等。KGB同時可以定義不同的動作,如抽取動作,並能自定義各類后處理程序。利用KGB知識圖譜引擎可以抽取到產品的詳細報價信息,方便進行下一步的數據挖掘與圖譜構建。

  數據挖掘技術是一個發展十分快的領域, 隨着對數據挖掘技術在各領域日益廣泛的應用,實現了數據資源共享及技術發展的跨域,從而大大提高了工作效率,並帶來巨大的成功。21世紀是信息時代的社會,“信息不僅是資源,更是財富”,要實現經濟的騰飛,需依賴高新尖科技的發展,故利用提供的信息,充分進行數據挖掘,則將為數據庫的應用開辟了廣闊的前景,也為人類的文明開辟了一個嶄新的時代。同時NLPIR大數據語義智能技術將對中文數據挖掘技術進行深入研究,必將提供出高質量、多功能的中文數據挖掘算法並促進自然語言理解系統的廣泛應用。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM