1
我已經設置了一個文件,如:Lucene的查詢詞除了在一個形式
doc1: "world is great. hello world"
doc2: "lucene is great. hello world"
doc3: "worldwide population"
doc4: "nothing important"
我需要查詢其選擇選擇[doc1, doc3]
,因爲它包含world
但不選擇[doc2]
,因爲它包含hello world
。
換句話說,我需要:「選擇所有包含單詞'world'的文檔,除非該單詞是'hello world'的一部分。」在文件中必須多次world
比有hello world
的。
類似於lucene查詢中的可能性,還是需要預處理文檔並將所有hello world
替換爲不包含world
的東西?
如果有negative boost
所以我想做某事像world AND "hello world"^-1
我不想排除「hello world」我只想在短語「hello world」中忽略單詞「world」。例如:「查找所有包含世界詞彙的文檔,除非該詞語處於'hello world'短語中。」 – svobol13