1
是否有人知道Ruby的地址解析器插件?Address Parser for Ruby
我可能不得不使用付費的網絡服務之一,但認爲可能有一個插件。
另一個想法是走下NLP路線,我可以建立一個數據庫隨着時間的推移。
有沒有人使用任何NLP插件的紅寶石?
我想用它來解析邏輯和消毒這樣的事情從HTML:
<address><strong>HALL (J&E) LTD</strong><br />Head Office<br />
Questor House<br />
191 Hawley Road<br />
Dartford<br />
Kent <br />
DA1 1PU</address>
<p class="tel"><strong>Tel:</strong> +44 (0)1322 223456</p>
<p class="fax"><strong>Fax:</strong> +44 (0)1322 291458</p>
<p><strong>Website:</strong> <a target="_blank" href="http://www.jehall.co.uk">www.jehall.co.uk</a></p>
<p><strong>Email:</strong> <a href="mailto:helpline@jehall.co.uk?subject=Enquiry%20from%20Defence%20Suppliers%20Directory&cc=defenceenquiries@armedforces.co.uk">helpline@jehall.co.uk</a></p>
</div>
任何建議欣然表示讚賞。
這有一個好處,你可以驗證地址實際存在(在大多數情況下),特別是如果你有郵政或郵政編碼 – bjg 2010-07-08 12:42:56
我認爲這是我的默認方式,如果有沒有什麼開箱的。它有很多意義。它只是降低成本。 – dagda1 2010-07-08 14:04:33
這種解決方案不適用於某些邊緣情況,例如,由於地址是新的或省略的,因此Google沒有將其編入索引。 – 2012-05-02 16:50:37