譯者言:本文介紹了如何批量刪除節點的屬性的方法,重點介紹了apoc.create.removeProperties 函數的使用。
今天早些時候,Irfan和我在一個數據集上做實驗,運行了一些圖形算法的程序,結果節點上多了一些屬性,所以,現在我要想辦法清理這些屬性。
現在的數據情況,可以用下面的語句模擬出來:
CREATE (:Node {name: "Mark", pagerank: 2.302, louvain: 1, lpa: 4 })CREATE (:Node {name: "Michael", degree: 23, triangles: 12, betweeness: 48.70 })CREATE (:Node {name: "Ryan", eigenvector: 2.302, scc: 1, unionFind: 4 })
除了name屬性,其他都是算法生成的,我要怎樣才能刪除這些生成的屬性呢?
我可以一次刪除一個屬性,像下面這樣:
MATCH (n:Node)REMOVE n.pagerank
對於其他要刪除的屬性只要重復這個命令就好,但是這個過程可有點痛苦啊----那么這個過程能自動化嗎?當然可以,接下來我們就來看看如何自動化這個過程。
首先,我們需要將每個節點的屬性除了name,都放到一個列表中。查詢語句如下:
neo4j> MATCH (n:Node) WITH [k in keys(n) where not k in ["name"]] as keys RETURN keys;+---------------------------------------+| keys |+---------------------------------------+| ["lpa", "pagerank", "louvain"] || ["betweeness", "degree", "triangles"] || ["unionFind", "eigenvector", "scc"] |+---------------------------------------+
接下來我們再來嘗試刪除這些屬性,這次我們的查詢語句這么寫:
neo4j> MATCH (n:Node) WITH n, [k in keys(n) where not k in ["name"]] as keys UNWIND keys AS key REMOVE n[key];Invalid input '[': expected an identifier character, whitespace, node labels, 'u/U', '{', 'o/O', a property map, a relationship pattern, '.' or '(' (line 4, column 9 (offset: 103))"REMOVE n[key];"
啊偶~, 出錯了.....趕快看看APOC是不是有刪除的方法,我也不知道APOC中有沒有相應的方法,所以,我輸入“remove”在APOC庫中進行搜索。具體語句如下:
CALL dbms.procedures() YIELD name, signature, descriptionWHERE name starts with "apoc" and description contains "remove"return name, signature, description
運行語句顯示下圖:
我看到apoc.create.removeProperties
方法,應該就是刪除屬性的,我們先來試一下:
neo4j> MATCH (n:Node) WITH n, [k in keys(n) where not k in ["name"]] as keys CALL apoc.create.removeProperties(n, keys) YIELD node RETURN count(*);+----------+| count(*) |+----------+| 3 |+----------+
我們再來看一下節點上還有哪些屬性:
neo4j> MATCH (n:Node) RETURN keys(n) AS keys;+----------+| keys |+----------+| ["name"] || ["name"] || ["name"] |+----------+
哦耶,太好了。
雖然屬性刪除了,但是我還是想再優化一下,看是否能夠不在每個節點上調用keys方法,而直接傳一個除name之外的屬性列表。我們可以先通過下面的語句得到除name之外的所有屬性:
neo4j> CALL db.propertyKeys() YIELD propertyKey WHERE propertyKey <> 'name' RETURN collect(propertyKey);+-----------------------------------------------------------------------------------------+| collect(propertyKey) |+-----------------------------------------------------------------------------------------+| ["degree", "pagerank", "louvain", "lpa", "triangles", "betweeness", "scc", "unionFind"] |+-----------------------------------------------------------------------------------------+
如果我要把那個屬性列表傳到apoc.create.removeProperties中,只要像下面這樣就可以了:
CALL db.propertyKeys() YIELD propertyKey WHERE propertyKey <> 'name'WITH collect(propertyKey) AS propertiesMATCH (n:Node)WITH collect(n) AS nodes, propertiesCALL apoc.create.removeProperties(nodes, properties)YIELD nodeRETURN count(*)
更多的數據
刪除小規模數據節點上的屬性時,上面的語句是可以正常工作的。但是在大型數據節點上去刪除屬性時,要怎么做呢?這時apoc.periodic.iterate
是你最好的選擇。
下面我們先來創建100萬個准備刪除屬性的節點:
CALL apoc.periodic.iterate( "UNWIND range(0, 1000000) AS id RETURN id", "CREATE (:Node {name: 'name-' + id, pagerank: 2.302, louvain: 1, lpa: 4 })", {})
現在我們稍微修改一下前面的刪除語句,將刪除除name之外的所有屬性:
neo4j> CALL db.propertyKeys() YIELD propertyKey WHERE propertyKey <> 'name' WITH collect(propertyKey) AS properties CALL apoc.periodic.iterate( "MATCH (n:Node) RETURN n", "WITH collect(n) AS nodes CALL apoc.create.removeProperties(nodes, $properties) YIELD node RETURN count(*)", {params: {properties: properties}}) YIELD batches RETURN batches;+---------+| batches |+---------+| 101 |+---------+
最后,我們再來確認一下,所有屬性是否都刪除了?
neo4j> MATCH (n:Node) RETURN keys(n), count(*);+---------------------+| keys(n) | count(*) |+---------------------+| ["name"] | 1000001 |+---------------------+
OK,完美!
原文鏈接: https://markhneedham.com/blog/2019/03/14/neo4j-delete-dynamic-properties/
譯者言:最后歡迎各位同行留言交流譯文中的不足。