2008-11-14 51 views
9

我有一組已輸入和excel電子表格的名稱和地址,但問題是許多輸入地址的人以許多不同的非標準格式輸入了它們。我希望在將所有地址傳送到我的數據庫之前清理地址。環顧四周,我真正發現的地址洗滌器(解析器或格式化器)的方式是由Semaphore推出的。出於我的目的,我並不需要所有這些,我也不想爲軟件的許可費支付費用。有沒有什麼是免費和/或開放源代碼可以幫我擦洗?開源地址Scrubber?

+0

也許提供一些示例數據。 – Till 2008-11-17 14:21:36

回答

6

由於我在郵寄業務工作...

可郵寄地址沒有地理編碼。一個允許USPS發送郵件,另一個告訴你該地點在哪裏。 USPS不會對其可郵寄地址進行地理編碼。這對標記區域/地區進行定位非常有用。

您並未購買該軟件的許可證,而是購買了該數據。郵局有很多規則,特別是如果你在商業上做這件事,並試圖獲得比一流的更好的速度。有關完整的規則列表,請參閱USPS Domestic Mail Manual。 USPS一直在拉鍊之間移動拉鍊和家庭。該公司(我工作)向USPS支付其更新的郵件列表,以便我們能夠更新我們的數據庫。每週。

回到你的問題。您是否想將數據更改爲常用格式(街道 - > st),或者您是否在尋找重複項,並且只想存儲真正的郵寄地址?

通用格式;你可以將地址分解成幾部分,清理空白處並應用術語/翻譯字典。然後應用一些SQL來查找重複項。請記住家庭(1個主要城市)與個人不同(John Doe,1個主要城市)。

爲郵寄地址,以及你們中的一些人(讀者)不會喜歡這個答案,但你想要的信息,這不是免費的。有人花費時間或金錢來獲取和維護這些列表。因此,找一個商業模式來獲取名單上的資金,或者找一個能爲你做的人。 Data and mail management

實際上,Semaphore是相當便宜的,只要記住地址db將不得不季度更新和$ 19 /季度是相當便宜。

另一個地址洗滌產品。 SAP PostalSoft。我不知道數據會花費什麼。

0

我與之合作過的大部分軟件都非常昂貴(或者換句話說,營銷部門天真並且預算龐大)。

這類工作是地理編碼的先驅。這linked Wiki article包括地理編碼軟件的列表,其中一些是免費的。如果幸運的話,一些免費的可能包括地址標準化例程。

如果你找到一個好的,請告訴我。

0

我們使用Accuzip。它比大多數解決方案便宜很多(約700美元/年),並附帶雙月更新。它使用USPS地址標準化API,爲此我編寫了一個.NET包裝器。這使我可以實時運行它(默認情況下,Accuzip僅帶有批處理模式)。

3

我居然在地址驗證行業工作NET包裝...吉姆的回答是一個聰明的接受。不幸的是,對於我們這些預算較低的人來說,美國官方的USPS數據價格昂貴且系統複雜。 (我知道的經驗,因爲我工作的公司,SmartyStreets,提供的地址驗證的速度比大多數都低)。

我可以在這裏幫助的最好的建議是一個低成本/免費的替代品(取決於您的體積),比如LiveAddress,其中地址列表沒有最低購買量,而API比較便宜且超級容易。

+0

更新:如果您仍然需要一個好的解決方案,地址驗證API服務(在SmartyStreets)現在可以免費使用。 – Matt 2012-01-12 05:33:22