爲什麼這兩個Cypher查詢返回不同的結果？

我努力學習Cypher和我有一個trust network的數據，我想查詢誰相信「15最信任的人」的人，所以我寫了這個查詢，QUERY1：爲什麼這兩個Cypher查詢返回不同的結果？

QUERY1: 

MATCH (u1:USER)-[:TRUST]->(u2:USER) 
with u2.Id as id, COUNT(u2) AS score 
order by score desc 
limit 15 
match p=(w1:USER)-[:TRUST]->(w2:USER {Id: id}) 
return w1.Id as user1, w2.Id as user2

，我以後想要將最後兩行查詢更改爲：

QUERY2: 

MATCH (u1:USER)-[:TRUST]->(u2:USER) 
with u2.Id as id, COUNT(u2) AS score 
order by score desc 
limit 15 
match p=(w1:USER)-[:TRUST]->(w2:USER {Id: id})-[:TRUST]->(w3:USER) 
return w1.Id as user1,w2.Id as user2, w3.Id as user3

並且在分析結果後，我猜測有什麼不對！所以我硬編碼id到特定的值，例如575，然後count(p)等於1937520，但是，如果我運行硬編碼ID查詢的最後一行，作爲一個獨立的查詢：

QUERY3: 

MATCH r=(u1:USER)-[:TRUST]->(u2:USER {Id: "575"})-[:TRUST]->(u3:USER) 
return count(r)

的count(r)等於到129168！

我檢查了用戶「575」信任207人並且被624人信任，所以QUERY3結果似乎是正確的：207 * 624 = 129168。我的問題是爲什麼？！我不明白QUERY2有什麼問題，第二個問題是否意味着QUERY1結果也是錯誤的？

EDIT1： 感謝的答案，但我仍然有這個問題，所以我檢查了另一個場景，我已經得到了以下結果：如果我寫這樣的查詢：

QUERY4: 
MATCH (n) WITH n limit 15 return "1"

我將在輸出中打印15「1」，所以這意味着QUERY2的最後一部分執行15次，無論我是否對Id進行硬編碼，就像它在for循環中一樣。所以這裏的問題是，我認爲WHIT X LIMIT N doSomeThing將像foreach(x : X)循環執行，如果我使用x，並且不會，如果我不使用x。愚蠢的假設...

來源

2017-04-25 M-N

在QUERY3中，您將u2與單個用戶（用戶575）相匹配。 QUERY 3是正確的。

但是，在QUERY2中，WITH（第3行）與15個不同的u1-u2組合相匹配。 MATCH（第1行）爲每個u1和u2返回一個「行」，這與該模式相匹配。那麼你只返回前15個結果，我猜是15個不同的u1 u2 = user {Id：575}這就是給出1937520個結果，這正好是15 * 129168.

問題在with出現是因爲你沒有聚合（每個u2只得到1行）。你爲每個u2用戶'返回'（使用WITH）一個id變量，所以count（u2）將永遠是1.也許你想寫u1.Id或count（u1）？無論如何，由於LIMIT 15（第4行），使用u2.Id或u1.Id將返回15個結果。 LIMIT 1會做的伎倆，但我們也可以這樣做：

MATCH (u1:User)-[:TRUST]-(u2:User) 
WITH DISTINCT(u2.Id) AS id 
LIMIT 15

然後是QUERY2的其餘部分（或QUERY1，對於這個問題）。我取消了分數變量，但是如果它意味着計數（u1），它可以被讀取而沒有問題。

來源

2017-04-25 18:13:36 yawmoght

你是對的，但如果我改變（W2：用戶{ID：ID}）QUERY2的一部分（W2：用戶{ID：「575」}）我得到1937520結果，不這意味着最後一個匹配部分爲USER「575」運行15次，因爲限制15？ –

謝謝，我編輯了答案來反映這一點。問題在於WITH上缺少DISTINCT，導致查詢多次返回同一用戶。 – yawmoght

此查詢可能會做你想要的。

MATCH (:USER)-[r:TRUST]->(u2:USER) 
WITH u2, COUNT(r) AS score 
ORDER BY score DESC 
LIMIT 15 
MATCH (w1:USER)-[:TRUST]->(u2)-[:TRUST]->(w3:USER) 
RETURN w1.Id AS user1, u2.Id AS user2, w3.Id AS user3;

它首先找到15個最信任的用戶，然後找到所有這些用戶都在中間的2級信任路徑，最後返回這些路徑的用戶的ID。

另外，第二個MATCH重複使用第一個MATCH已經找到的u2節點，以加速處理第二個MATCH。

來源

2017-04-25 20:14:39 cybersam

我只是打破查詢2，其餘的應該是有道理的。

QUERY2: 

MATCH (u1:USER)-[:TRUST]->(u2:USER) 
with u2.Id as id, COUNT(u2) AS score 
order by score desc 
limit 15 
match p=(w1:USER)-[:TRUST]->(w2:USER {Id: id})-[:TRUST]->(w3:USER) 
return w1.Id as user1,w2.Id as user2, w3.Id as user3

與

MATCH (u1:USER)-[:TRUST]->(u2:USER) 
with u2.Id as id, COUNT(u2) AS score 
order by score desc 
limit 15

你基本上創建所有U1信託U2的啓動列表;和COUNT（u2）= u2的＃匹配。因此，假設u1相信u2有100個匹配項，COUNT（u2）會爲每一行在該列中放置'100'。（然後你爲了什麼現在是一個常量，它什麼也不做，並限制15，所以你現在有15 U1信託U2的任意列表。

使剛剛離開

match p=(w1:USER)-[:TRUST]->(w2:USER {Id: id})-[:TRUST]->(w3:USER)

使匹配用戶w1信任用戶w2的每個路徑p（用於每個用戶的id），並相信用戶w3。

因此，修復第一部分，以獲得'前15個可信用戶，你需要統計傳入信託的數量

MATCH (u1:USER)-[trusts:TRUST]->(u2:USER) 
with u2, COUNT(trusts) AS score 
order by score desc 
limit 15

所以現在你有15個最值得信賴的用戶，你可以用return u2.id, score來驗證這一點。爲了讓誰相信這些人，你會比只需要問這樣的人......

MATCH (u3:USER)-[:TRUST]->(u2)

，然後U3會是誰信任來自排名前15位信任的人（U2）一個人的所有用戶。

作爲一個額外的注意，如果您使用的是Neo4j的Web瀏覽器，嘗試配置文件關鍵字您的CYPHER一些洞察到什麼暗號查詢實際執行前掛起。

編輯1：

我們解釋一下查詢4確實MATCH (n) WITH n limit 15 return "1"。正如我相信你一定猜到了，MATCH (n) WITH n limit 15比賽的所有節點，但結果限制到第一15.在返回部分，你說：「對於每一行，返回常量‘1’。」，這給你內部15個不同行，但返回的行不明顯。這是DISTINCT關鍵字的用途。使用RETURN DISTINCT「1」表示「對於每一行，返回常量'1'，但過濾結果集只有不同的行。」又如，沒有2列將具有相同的價值。如果你知道會有一些重複的行，但要看到他們反正（也許對於一個重量的參考，或知道他們是從2個獨立的字段）的非明顯的結果是有用的。

來源

2017-04-26 19:58:47 Tezra

謝謝，我從你的答案中學到了很多東西，爲PROFILE關鍵字+1了，但是我的問題是其他問題。我在EDIT1中提到過它。 –

@ M-N不確定查詢4對您的問題實際上意味着什麼，但是我添加了對查詢4做什麼的解釋，以便您可以理解結果。：3 – Tezra

正如我在EDIT1中提到的，這裏的問題是我認爲WHIT X LIMIT N doSomeThing將像foreach(x : X)循環一樣執行，如果我使用x，並且不會，如果我不使用x。愚蠢的假設......

來源

2017-04-28 04:18:33

爲什麼這兩個Cypher查詢返回不同的結果？

回答

相關問題