我正在嘗試使用xpath和nokogiri來提取谷歌圖片的圖片網址。當我右鍵單擊圖像並複製其xpath,我得到以下內容:用Nokogiri和Xpath提取圖片鏈接
// * [@ id =「irc_cc」]/div [3]/div [1]/div [1]/div [ 2]/div [1]/a/img
但是,當我把它放到nokogiri xpath調用中時,沒有任何返回。關於如何捕獲圖像URL的任何想法?謝謝!
require "open-uri"
require "mechanize"
require "net/http"
base_url = "https://www.google.com/search?
tbm=isch&tbs=isz:lt,islt:vga&q=Analog%20Bar%20San%20Diego%20Burgers"
doc = Nokogiri::HTML(open(base_url))
doc.xpath('//*[@id="irc_cc"]/div[3]/div[1]/div[1]/div[2]/div[1]/a/img').each do |node|
puts node
end
我找不到任何id爲'irc_cc'的html元素 – gotva 2014-09-30 09:07:24
嗯好吧,所以我沒有查看源代碼,我也沒有看到任何與irc_cc。我得到這個Xpath的方式是右鍵單擊Google中的圖像並單擊檢查元素,然後右鍵單擊該元素並單擊複製XPath。有沒有更好的方法來做到這一點? – Brandon 2014-09-30 09:10:34
我知道「複製XPATH」方便快捷,但它看起來像這個功能有一個bug ...你總是可以手動構建你的XPATH – gotva 2014-09-30 09:17:05