祝大家:如何使用紅寶石獲取HTML <cite>標籤之間的字符串?
我很想從大量的Google搜索結果頁面中獲取一些信息。 我唯一需要的是一組<cite></cite>
HTML標籤中的網址。
我不能得到解決方案,以任何其他正確的方式來處理這個問題,所以現在我正在轉向紅寶石。
這是迄今爲止我已經寫了:(?因爲它錯過了make命令或某事)
require 'net/http'
require 'uri'
url=URI.parse('http://www.google.com.au')
res= Net::HTTP.start(url.host, url.port){|http|
http.get('/#hl=en&q=helloworld')}
puts res.body
可惜我不能使用推薦的角度來說,Hpricot紅寶石寶石
所以我想堅持用這種方法。
現在,我可以將響應正文作爲字符串獲取,我唯一需要的是檢索ciite中的任何內容(移除我以查看真實名稱:))HTML標記。
我該怎麼做?使用正則表達式?任何人都可以給我一個例子嗎?
你爲什麼不張貼我們如何能幫助解決您的角度來說,Hpricot問題一個問題? – 2009-09-18 02:27:57