和關系數據庫一樣,Neo4j同樣可以創建索引來加快查找速度。
在關系數據庫中創建索引需要索引字段和指向記錄的指針,通過索引可以快速查找到表中的行。
在Neo4j中,其索引是通過屬性來創建,便於快速查找節點或者關系。
手動索引
先來說一下怎樣創建手動索引。
創建索引采用顯示創建,就像添加節點一樣添加索引項,一個索引項標識的是一個節點或者關系的屬性值。
索引項中除了包含屬性值,還存儲了對正在索引的屬性具有特定值的一個或多個節點的引用。
以上是一個使用email
屬性作為鍵值指向節點的索引。
先通過下面代碼添加數據。
try (Transaction tx = graphDb.beginTx()) { // 添加數據 Label label = Label.label("Student"); Node node1 = graphDb.createNode(label); node1.setProperty("name", "王翠花"); node1.setProperty("email", "hua@qq.com"); Node node2 = graphDb.createNode(label); node2.setProperty("name", "李小明"); node2.setProperty("email", "ming@163.com"); Node node3 = graphDb.createNode(label); node3.setProperty("name", "楊小紅"); node3.setProperty("email", "hong@gmail.com"); node1.createRelationshipTo(node2, RelTypes.IS_FRIEND_OF); node1.createRelationshipTo(node3, RelTypes.IS_FRIEND_OF); // 提交事務 tx.success(); }
通過Neo4j查看,添加成功。
下面來創建索引。
Neo4j中使用IndexManager
來管理索引,然后通過索引標識符來訪問索引。
IndexManager indexManager = graphDb.index();
Index<Node> stuIndex = indexManager.forNodes("students");
上面個兩行代碼通過students
向索引管理器去請求獲得一個索引。
假如索引不存在則會自動創建。
因為是手動創建索引,所以還需要告訴數據庫要添加的屬性和對應的節點。
stuIndex.add(node1, "email", "hua@qq.com"); stuIndex.add(node2, "email", "ming@163.com"); stuIndex.add(node3, "email", "hong@gmail.com");
要添加一個節點到索引中,需要提供三個參數:需要索引的節點、索引鍵和索引的值。
索引創建好之后,來嘗試通過索引查找節點。
try (Transaction tx = graphDb.beginTx()) { String stuEmail = "hua@qq.com"; // 獲得索引 IndexManager indexManager = graphDb.index(); Index<Node> stuIndex = indexManager.forNodes("students"); // 獲得結果集 IndexHits<Node> indexHits = stuIndex.get("email", stuEmail); // getSingle()會返回唯一結果,不唯一的話返回null Node stu = indexHits.getSingle(); System.out.println(stu.getProperty("name", new String())); } //Output 王翠花
如果一個索引對應着多個節點,例如如果將年齡作為索引鍵,那么會有多個學生節點有着相同的年齡。
這種情況迭代IndexHits
即可。有兩點需要注意:
- IndexHits是一次性迭代,不能重復使用。
- 使用完IndexHits后應該關閉。如果所有結果都已迭代,IndexHits會自動關閉,否則需要調用close()方法手動關閉。
在關系數據庫中,如果更改有索引的數據,索引也會跟着自動更新。
但是對於Neo4j中采用手動方式創建的索引,Neo4j並不會隨着數據的改變而自動更新。
既然沒有這種機制,那么只能采用一種笨方法,就是“先刪除后添加”等於“更新”。
刪除索引使用Index的remove()
方法。
try (Transaction tx = graphDb.beginTx()) { String stuEmail = "hua@qq.com"; // 獲得索引 IndexManager indexManager = graphDb.index(); Index<Node> stuIndex = indexManager.forNodes("students"); // 獲得要刪除索引對應的節點 Node stuNode = stuIndex.get("email", stuEmail).getSingle(); // 刪除索引 stuIndex.remove(stuNode, "email", stuNode.getProperty("email")); // 輸出 for (Node n : stuIndex.query("email", "*")) { System.out.println(n.getProperty("name")); }
} // Output 李小明 楊小紅
可以看到一個索引項已經刪除,這時重新對節點的屬性進行設置,然后調用索引的add()
方法就能完成手動的更新。
如果想刪除整個索引,使用delete()
方法。
indexManager.forNodes(indexName).delete();
相對於對節點建索引,關系索引很少用到,因為需要查詢的對象一般都是實體,也就是節點。
雖然可以手動創建和維護索引,但是感覺很麻煩,下面介紹由數據庫自動創建和維護索引的方法。
模式索引
模式索引和關系數據庫中的索引很相似。
每一個索引會對應一個標簽和一組屬性。例如對學生的姓名name
進行索引,你只需要定義索引,數據庫會負責維護它們。
無論是更新還是刪除節點,索引都會自動更新或者刪除。
創建模式索引的方法如下:
IndexDefinition indexDefinition; try (Transaction tx = graphDb.beginTx()) { Schema schema = graphDb.schema(); indexDefinition = schema.indexFor(Label.label("Student")).on("name").create(); tx.success(); }
首先要獲取數據庫的模式,然后提供Label
和Property
就完成了索引的創建,比手動創建簡單了不少。
查詢也同樣簡單,使用ResourceIterator
存放結果集。
需要注意,如果ResourceIterator沒有完全迭代,則需要使用close()
方法手動關閉。
try (Transaction tx = graphDb.beginTx()) { ResourceIterator<Node> stus = graphDb.findNodes(Label.label("Student"), "name", "王翠花"); while (stus.hasNext()) { System.out.println(stus.next().getProperties("name", "email")); } tx.success(); }
輸出結果:
{name=王翠花, email=hua@qq.com}
刪除索引的方法:
try (Transaction tx = graphDb.beginTx()) { Label label = Label.label("Student"); for (IndexDefinition indexDefinition : graphDb.schema().getIndexes(label)) { // There is only one index indexDefinition.drop(); } tx.success(); }
自動索引
《Neo4j 實戰》這本書中的數據庫版本是2.x,書中提到了自動索引,一種通過配置文件來創建索引的方法。
但是在目前的3.x版本中已經廢棄,建議使用模式索引代替。
何時使用索引
《你知道數據庫索引的工作原理嗎》看完這篇文章,復習了關系數據庫中的索引,也對理解圖數據庫的索引有所幫助,因為兩者大同小異。
創建索引都是為了加快查找速度,但是索引的缺點就是會占用額外的磁盤空間,索引太多可能會導致磁盤空間不足,在進行插入和更新操作時也會影響性能。
下圖是使用索引和不使用索引查找搜索所有節點所需要的時間對比:
圖片來源:《Neo4j 實戰》
可以看到使用索引大大加快了查找速度。但是有時在查詢上提高的性能可能會被抵消。
下圖顯示了隨着節點數量的增加,創建一個新節點所需的時間,有索引情況下需要的時間差不多是無索引的兩倍。
圖片來源:《Neo4j 實戰》
所以在創建索引時要有所權衡,對於那寫頻繁更新和創建的數據要謹慎選擇索引。
轉載請注明原文鏈接:http://www.cnblogs.com/justcooooode/p/8182376.html
參考資料
https://neo4j.com/docs/java-reference/3.2/#tutorials-java-embedded-index
《Neo4j 實戰》