2010-07-08 52 views
1

是否有人知道Ruby的地址解析器插件?Address Parser for Ruby

我可能不得不使用付費的網絡服務之一,但認爲可能有一個插件。

另一個想法是走下NLP路線,我可以建立一個數據庫隨着時間的推移。

有沒有人使用任何NLP插件的紅寶石?

我想用它來解析邏輯和消毒這樣的事情從HTML:

<address><strong>HALL (J&amp;E) LTD</strong><br />Head Office<br /> 
    Questor House<br /> 
    191 Hawley Road<br /> 
    Dartford<br /> 
    Kent <br /> 
    DA1 1PU</address> 
    <p class="tel"><strong>Tel:</strong> +44 (0)1322 223456</p> 
    <p class="fax"><strong>Fax:</strong> +44 (0)1322 291458</p> 
    <p><strong>Website:</strong> <a target="_blank" href="http://www.jehall.co.uk">www.jehall.co.uk</a></p> 
    <p><strong>Email:</strong> <a href="mailto&#58;helpline&#64;jehall&#46;co&#46;uk?subject=Enquiry%20from%20Defence%20Suppliers%20Directory&amp;cc=defenceenquiries&#64;armedforces&#46;co&#46;uk">helpline&#64;jehall&#46;co&#46;uk</a></p> 
</div> 

任何建議欣然表示讚賞。

回答

1

您可能會使用Google地理編碼服務獲得一些成功。這可以返回結構化地址。有寶石與寶石地圖API

+0

這有一個好處,你可以驗證地址實際存在(在大多數情況下),特別是如果你有郵政或郵政編碼 – bjg 2010-07-08 12:42:56

+0

我認爲這是我的默認方式,如果有沒有什麼開箱的。它有很多意義。它只是降低成本。 – dagda1 2010-07-08 14:04:33

+0

這種解決方案不適用於某些邊緣情況,例如,由於地址是新的或省略的,因此Google沒有將其編入索引。 – 2012-05-02 16:50:37