我有兩個集合items
與120,000條目和itemHistories
與超過2000萬條目。我通過提取一個API來定期更新所有items
和itemHistories
,該API列出了項目的所有history
數據。Mongo批量插入並避免重複值爲多個鍵
我需要做的是批量插入歷史數據到集合,同時避免重複。此外,歷史API僅返回date
,info
,item_id
值。
是否有可能在Mongo中批量插入,以便它不會爲2個值(日期,item_id)添加重複項。因此,如果已有與date
和item_id
相同的條目,請不要添加它。基本上date
是item_id
的唯一索引。允許在集合中具有重複的date
值,但前提是item_id
對於所有重複項都是不同的。
一個項目可能有近百萬個條目,所以我不認爲從集合中獲取歷史記錄並將其與API響應進行比較將是最佳選擇。
我目前的想法是在名爲hash
的集合中添加另一個關鍵字md5(date,info,item_id)
並使其成爲唯一索引。建議?