2011-08-19 72 views
0

我收集了一些關於某些公司的信息,這些公司的地址以及一些垃圾數據被抓取並存儲在數據庫中。我想,以確定地址,並刪除留言中,或垃圾數據,例如,地址或位置標識

- junk here 
- junk here 
- 10100 Trinity Parkway, 5th Floor Stockton, CA 95219 
- junk here 

正如你在我的數據庫中的垃圾數據以及實際地址看看有沒有我想要消除垃圾數據,並確定實際地址。

是否有可能通過Java或任何其他免費API?

感謝,
KARTHIK

回答

0

使用CASS software擦洗地址。像美國郵政網絡界面的免費API通常假設你只發送地址,所以如果你的前綴/後綴垃圾準備發送多次嘗試,然後保持最佳匹配。

1

您肯定需要一個在線地址驗證服務。 Java(或任何其他編程語言)本身並不具備理解地址的能力。您需要在編程語言環境之外使用真相源。

對於使用Google Maps的建議已經在這裏,我認爲這是一個基準解決方案,但答案的質量很大程度上取決於數據的質量,這聽起來不太好。即使如此,結果仍然存在問題,因爲Google地圖的設計不考慮地址驗證。這也取決於您的業務需求。如果你打算髮郵件,那麼在發送郵件給它之前,你絕對要驗證一個地址是否存在使用真正的服務,否則你基本上會丟掉數百甚至數千美元。

有一些address verification服務在那裏我的公司,SmartyStreets,是一個。您需要根據您的預算(如果有)和業務需求確定最適合貴公司的產品。我們提供上傳文本文件或Excel文件的能力,並對其進行清理和處理,或者,如果您願意,可以使用我們的address verification web service API並單獨推送地址。