我目前正在編寫一個python應用程序,該應用程序將採用文本文件的目錄並根據文本文件中指定的屬性將它們解析爲自定義python對象。作爲我的應用程序的一部分,我將當前加載的對象數據集與先前的數據集(相同格式)進行比較,並對其進行掃描以找出可能的重複,衝突,更新等。但是,由於一次可能有〜10,000個對象,我真的不知道如何解決這個問題。Python對象存儲內存/字典/數據庫/其他選項
我正在將以前的數據集存儲在數據庫中,因爲它正在被另一個Web應用程序使用。截至目前,我的python應用程序將'建議'的數據集加載到內存中(創建規則對象),然後將這些對象存儲在字典中(問題#1)。然後,當需要比較時,我使用SQL查詢和失敗插入的組合來確定新的/現有的和現有但更新的條目(問題#2)。
充其量是可惡而可怕的。我正在尋找一些關於重構應用程序和處理對象存儲/比較的建議。