我對ElasticSearch比較新。我正在使用它作爲pdf文檔的搜索平臺。我把PDF分成文本頁面,並將其作爲一個elasticSearch記錄,並輸入相應的頁面ID,父級信息等。使用ElasticSearch匹配多個文檔
我發現很難將給定的查詢不僅與ES中的單個文檔進行匹配,但要使它與具有相同父代ID的任何文檔匹配。因此,如果搜索了兩個詞語,如果實際PDF文檔的第1頁和第7頁中存在這些詞語(2個單獨的詞條進入ES),我想匹配這個結果。
本質上,我的目標是能夠搜索單個PDF的多個頁面,匹配PDF上的任何文檔頁面上發生的事件,並返回搜索結果的匹配PDF文檔列表,而不是的匹配「頁面」
非常感謝迄今爲止的答案。我想澄清要求。 Duc.duong建議使用has_child,這似乎是最合乎邏輯的。我想補充一點,我需要能夠確定(也許通過輔助查詢)匹配發生的頁面。 – lwdjustin