我從JSON解析文檔,JSON將作爲父文檔的子元素添加。我只是將項目發佈到索引,而不關心該ID。避免Elasticsearch中的重複文檔
有時候會有JSON的更新,並且項目會被添加到它。所以例如我從JSON解析了2個文檔,並在一兩個星期後再次解析相同的JSON。這次JSON包含3個文檔。
我找到如下答案:'remove all children and insert all items。',但我懷疑這是我正在尋找的解決方案。
如果沒有平等的孩子,我可以將每個項目與我的目標父母的孩子進行比較並添加新文檔。
我想知道是否有辦法讓elasticsearch處理重複。
如果ID每次都不同,那麼這是不可能的。 Elasticsearch不處理重複。 –
你可以使用數據庫中的某些主鍵或某種散列機制爲給定文檔生成唯一標識符。如果發佈文檔時未指定_id,ES將爲每個文檔生成'unique' _id,而不管其中的內容 – ChintanShah25