目前我們存儲我們的地址數據,像這樣:將街道地址數據清晰地存儲而不僅僅是字符串有什麼好處嗎?
string suiteNumber (ie. unit number)
string streetNumber (building number)
string streetName
string streetDirection (N/NW/S/etc.)
string streetType (rd/st/ave/etc.)
// ... etc. (postal code/city/province/state/country
但我正在與時務解析出第5個地址部分和導入地址(從我可以告訴常見)的問題。
我在想,如果街道地址只是一個字符串(db中的varchar),所有這一切都將變得非常容易。
有兩個參數,我已經給出了爲什麼我們應該保持原樣: 1.搜索更容易,當您可以搜索只是街道名稱或號碼等,但我在想一個SQL腳本沿線的選擇x從地址WHERE街道地址喜歡「%INPUT%」;當然,它不是那麼快,但它可以工作(並且該搜索的數據集僅限於客戶比我們存儲的所有地址的集合小得多)。
- 目前我們有一個系統標記公寓 - 如果您發現1個人在地址A是公寓,我們標記他們,它會搜索該街道上的所有其他人/ streetname和他們的標誌,以及(這是一個有時重要的業務需求)
我已經儲存所有的,因爲在地址無數例外的字符串。
所以我問,是否需要/想要分開存儲街道地址部分的特殊原因?
非常有趣的博客文章。你如何處理Land Data(至少在加拿大)?像土地部分,陸地部分,土地所有者/西部地區,土地美元線等? – 2009-10-26 19:03:57
+1非常有趣的博客文章。谷歌地圖怎麼弄出我的意思是通過自由文本輸入?我可以拋出幾乎任何類型的地址格式,它運行良好。 – I82Much 2009-10-26 20:06:53
我假設,但這是我得到的:他們有一堆商品電腦來解析你輸入的信息。然後對照已驗證並正確存儲的數據進行檢查,以便快速進行快速掃描。每個機器都必須解析數百萬個地址才能驗證數據,這是值得懷疑的。十幾臺機器可以解析和驗證加拿大僅有的10萬個獨立地址,這比單臺機器對120萬個列表的驗證要快得多。 – BenAlabaster 2009-10-26 20:14:03