2017-06-01 35 views
1

我已經設置了一個文件,如:Lucene的查詢詞除了在一個形式

doc1: "world is great. hello world" 
doc2: "lucene is great. hello world" 
doc3: "worldwide population" 
doc4: "nothing important" 

我需要查詢其選擇選擇[doc1, doc3],因爲它包含world但不選擇[doc2],因爲它包含hello world

換句話說,我需要:「選擇所有包含單詞'world'的文檔,除非該單詞是'hello world'的一部分。」在文件中必須多次world比有hello world的。

類似於lucene查詢中的可能性,還是需要預處理文檔並將所有hello world替換爲不包含world的東西?

如果有negative boost所以我想做某事像world AND "hello world"^-1

回答

0

是這個術語的hello world保持相同這將是巨大?

如果是的話,我們可以添加fq = NOT fieldname:「hello world」來查詢嗎?

+0

我不想排除「hello world」我只想在短語「hello world」中忽略單詞「world」。例如:「查找所有包含世界詞彙的文檔,除非該詞語處於'hello world'短語中。」 – svobol13