本文轉載自 [https://www.jianshu.com/p/500448f810c5]
介紹
Neo4j是一個高性能的,NOSQL圖形數據庫,它將結構化數據存儲在網絡上而不是表中。Neo4j也可以被看作是一個高性能的圖引擎,該引擎具有成熟數據庫的所有特性。程序員工作在一個面向對象的、靈活的網絡結構下而不是嚴格、靜態的表中——但是他們可以享受到具備完全的事務特性、企業級的數據庫的所有好處。
Neo4j因其嵌入式、高性能、輕量級等優勢,越來越受到關注。
圖形數據結構
在一個圖中包含兩種基本的數據類型:Nodes(節點) 和 Relationships(關系)。Nodes 和 Relationships 包含key/value形式的屬性。Nodes通過Relationships所定義的關系相連起來,形成關系型網絡結構。
使用場景
我們可以將圖領域划分成以下兩部分:
1. 用於聯機事務圖的持久化技術(通常直接實時地從應用程序中訪問)。
這類技術被稱為圖數據庫,它們和“通常的”關系型數據庫世界中的聯機事務處理(Online Transactional Processing,OLTP)數據庫是一樣的。
2. 用於離線圖分析的技術(通常都是按照一系列步驟執行)。
這類技術被稱為圖計算引擎。它們可以和其他大數據分析技術看做一類,如數據挖掘和聯機分析處理(Online Analytical Processing,OLAP)。
圖數據庫一般用於事務(OLTP)系統中。圖數據庫支持對圖數據模型的增、刪、改、查(CRUD)方法。相應地,它們也對事務性能進行了優化,在設計時通常需要考慮事務完整性和操作可用性。
目前圖數據庫的巨大用途得到了認可,它跟不同領域的很多問題都有關聯。最常用的圖論算法包括各種類型的最短路徑計算、測地線(Geodesic Path)、集中度測量(如PageRank、特征向量集中度、親密度、關系度、HITS等)
目前,業內已經有了相對比較成熟的基於圖數據庫的解決方案,大致可以分為以下幾類。
金融行業應用
反欺詐多維關聯分析場景
通過圖分析可以清楚地知道洗錢網絡及相關嫌疑,例如對用戶所使用的帳號、發生交易時的IP地址、MAC地址、手機IMEI號等進行關聯分析。
反欺詐已經是金融行業一個核心應用,通過圖數據庫可以對不同的個體、團體做關聯分析,從人物在指定時間內的行為,例如去過地方的IP地址、曾經使用過的MAC地址(包括手機端、PC端、WIFI等)、社交網絡的關聯度分析,同一時間點是否曾經在同一地理位置附近出現過,銀行賬號之間是否有歷史交易信息等。
社交網絡圖譜
企業關系圖譜
圖數據庫可以對各種企業進行信息圖譜的建立,包括最基本的工商信息,包括何時注冊、誰注冊、注冊資本、在何處辦公、經營范圍、高管架構。圍繞企業的經營范圍,繼續細化去查詢企業究竟有哪些產品或服務,例如通過企業名稱查詢到企業的自媒體,從而給予其更多關注和了解。另外也包括對企業的產品和服務的數據關聯,查看該企業有沒有令人信服的自主知識產權和相關資質來支撐業務的開展。
企業在日常經營中,與客戶、合作伙伴、渠道方、投資者都會打交道,這也決定了企業對社會各個領域都廣有涉獵,呈現面錯綜復雜,因此可以通過企業數據圖譜來查詢,層層挖掘信息。基於圖數據的企業信息查詢可以真正了解企業的方方面面,而不再是傳統單一的工商信息查詢。