2008-10-09 52 views
1

您如何模擬您的客戶地址數據以及您使用哪些技術來確保數據的質量?客戶檔案設計

像重複數據刪除算法,重複匹配,確保包和發票實際上可以交付,等等?特別是在處理多個國家客戶的系統中。

+0

您正在設計*文件*還是*數據庫*?他們非常不同。一個是物理數據存儲的抽象,另一個是你永遠不應該做的事情。在這種情況下, – Tanktalus 2008-10-09 22:19:13

回答

1

有許多供應商提供地址驗證和標準化(將多個等效地址轉換爲標準格式)作爲服務。其中一些供應商還提供了在該地址計算稅金以用於開票目的的能力。一旦你有地址的規範化形式,找到重複只是一個比較項目的問題(你可能想使用散列速度)。我很猶豫是否認可此軟件的特定供應商,甚至在Stackoverflow上列出一些供應商...