Neo4j學習筆記(2)——手動索引和模式索引


和關系數據庫一樣,Neo4j同樣可以創建索引來加快查找速度。

在關系數據庫中創建索引需要索引字段和指向記錄的指針,通過索引可以快速查找到表中的行。

在Neo4j中,其索引是通過屬性來創建,便於快速查找節點或者關系。

手動索引

先來說一下怎樣創建手動索引。

創建索引采用顯示創建,就像添加節點一樣添加索引項,一個索引項標識的是一個節點或者關系的屬性值。

索引項中除了包含屬性值,還存儲了對正在索引的屬性具有特定值的一個或多個節點的引用。

以上是一個使用email屬性作為鍵值指向節點的索引。

先通過下面代碼添加數據。

try (Transaction tx = graphDb.beginTx()) {
    // 添加數據
    Label label = Label.label("Student");
    Node node1 = graphDb.createNode(label);
    node1.setProperty("name", "王翠花");
    node1.setProperty("email", "hua@qq.com");
    Node node2 = graphDb.createNode(label);
    node2.setProperty("name", "李小明");
    node2.setProperty("email", "ming@163.com");
    Node node3 = graphDb.createNode(label);
    node3.setProperty("name", "楊小紅");
    node3.setProperty("email", "hong@gmail.com");
    node1.createRelationshipTo(node2, RelTypes.IS_FRIEND_OF);
    node1.createRelationshipTo(node3, RelTypes.IS_FRIEND_OF);
        // 提交事務
        tx.success();
}

 通過Neo4j查看,添加成功。

下面來創建索引。

Neo4j中使用IndexManager來管理索引,然后通過索引標識符來訪問索引。

IndexManager indexManager = graphDb.index();
Index<Node> stuIndex = indexManager.forNodes("students");

上面個兩行代碼通過students向索引管理器去請求獲得一個索引。

假如索引不存在則會自動創建。

因為是手動創建索引,所以還需要告訴數據庫要添加的屬性和對應的節點。

stuIndex.add(node1, "email", "hua@qq.com");
stuIndex.add(node2, "email", "ming@163.com");
stuIndex.add(node3, "email", "hong@gmail.com");

要添加一個節點到索引中,需要提供三個參數:需要索引的節點索引鍵索引的值

索引創建好之后,來嘗試通過索引查找節點。

try (Transaction tx = graphDb.beginTx()) {
    String stuEmail = "hua@qq.com";
    // 獲得索引
    IndexManager indexManager = graphDb.index();
    Index<Node> stuIndex = indexManager.forNodes("students");
    // 獲得結果集
    IndexHits<Node> indexHits = stuIndex.get("email", stuEmail);
    // getSingle()會返回唯一結果,不唯一的話返回null
    Node stu = indexHits.getSingle();
    System.out.println(stu.getProperty("name", new String()));
}
//Output
王翠花

如果一個索引對應着多個節點,例如如果將年齡作為索引鍵,那么會有多個學生節點有着相同的年齡。

這種情況迭代IndexHits即可。有兩點需要注意:

  1. IndexHits是一次性迭代,不能重復使用。
  2. 使用完IndexHits后應該關閉。如果所有結果都已迭代,IndexHits會自動關閉,否則需要調用close()方法手動關閉。

在關系數據庫中,如果更改有索引的數據,索引也會跟着自動更新。

但是對於Neo4j中采用手動方式創建的索引,Neo4j並不會隨着數據的改變而自動更新。

既然沒有這種機制,那么只能采用一種笨方法,就是“先刪除后添加”等於“更新”。

刪除索引使用Index的remove()方法。

try (Transaction tx = graphDb.beginTx()) {
    String stuEmail = "hua@qq.com";
    // 獲得索引
    IndexManager indexManager = graphDb.index();
    Index<Node> stuIndex = indexManager.forNodes("students");
    // 獲得要刪除索引對應的節點
    Node stuNode = stuIndex.get("email", stuEmail).getSingle();
    // 刪除索引
    stuIndex.remove(stuNode, "email", stuNode.getProperty("email"));
    // 輸出
    for (Node n : stuIndex.query("email", "*")) {
        System.out.println(n.getProperty("name"));
    }
}
// Output 李小明 楊小紅

可以看到一個索引項已經刪除,這時重新對節點的屬性進行設置,然后調用索引的add()方法就能完成手動的更新。

如果想刪除整個索引,使用delete()方法。

indexManager.forNodes(indexName).delete();

相對於對節點建索引,關系索引很少用到,因為需要查詢的對象一般都是實體,也就是節點。

雖然可以手動創建和維護索引,但是感覺很麻煩,下面介紹由數據庫自動創建和維護索引的方法。

模式索引

模式索引和關系數據庫中的索引很相似。

每一個索引會對應一個標簽和一組屬性。例如對學生的姓名name進行索引,你只需要定義索引,數據庫會負責維護它們。

無論是更新還是刪除節點,索引都會自動更新或者刪除。

創建模式索引的方法如下:

IndexDefinition indexDefinition;
try (Transaction tx = graphDb.beginTx()) {
    Schema schema = graphDb.schema();
    indexDefinition = schema.indexFor(Label.label("Student")).on("name").create();
    tx.success();
}

首先要獲取數據庫的模式,然后提供LabelProperty就完成了索引的創建,比手動創建簡單了不少。

查詢也同樣簡單,使用ResourceIterator存放結果集。

需要注意,如果ResourceIterator沒有完全迭代,則需要使用close()方法手動關閉。

try (Transaction tx = graphDb.beginTx()) {
    ResourceIterator<Node> stus = graphDb.findNodes(Label.label("Student"), "name", "王翠花");
    while (stus.hasNext()) {
        System.out.println(stus.next().getProperties("name", "email"));
    }
    tx.success();
}

輸出結果:

{name=王翠花, email=hua@qq.com}

刪除索引的方法:

try (Transaction tx = graphDb.beginTx()) {
    Label label = Label.label("Student");
    for (IndexDefinition indexDefinition : graphDb.schema().getIndexes(label)) {
        // There is only one index
        indexDefinition.drop();
    }
    tx.success();
}

自動索引

《Neo4j 實戰》這本書中的數據庫版本是2.x,書中提到了自動索引,一種通過配置文件來創建索引的方法。

但是在目前的3.x版本中已經廢棄,建議使用模式索引代替。

何時使用索引

《你知道數據庫索引的工作原理嗎》看完這篇文章,復習了關系數據庫中的索引,也對理解圖數據庫的索引有所幫助,因為兩者大同小異。

創建索引都是為了加快查找速度,但是索引的缺點就是會占用額外的磁盤空間,索引太多可能會導致磁盤空間不足,在進行插入和更新操作時也會影響性能。

下圖是使用索引和不使用索引查找搜索所有節點所需要的時間對比:

圖片來源:《Neo4j 實戰》

可以看到使用索引大大加快了查找速度。但是有時在查詢上提高的性能可能會被抵消。

下圖顯示了隨着節點數量的增加,創建一個新節點所需的時間,有索引情況下需要的時間差不多是無索引的兩倍。

 

圖片來源:《Neo4j 實戰》

所以在創建索引時要有所權衡,對於那寫頻繁更新和創建的數據要謹慎選擇索引。


 轉載請注明原文鏈接:http://www.cnblogs.com/justcooooode/p/8182376.html

參考資料

https://neo4j.com/docs/java-reference/3.2/#tutorials-java-embedded-index

《Neo4j 實戰》


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM