2017-03-15 81 views
0

我想要獲取URL上的所有圖像src,但我被卡住了錯誤「實體名稱必須緊跟在實體引用中'&'之後。」請幫忙。解析HTML以獲取所有img src Google腳本

function getimageurls(){ 

    var url ="https://www.zillow.com/homes/for_sale/Baltimore-MD-21224/36431822_zpid/66834_rid/globalrelevanceex_sort/39.317168,-76.41386,39.2393,-76.64835_rect/11_zm/"; 

    var html = UrlFetchApp.fetch(url).getContentText(); 

    Logger.log(html) 

} 
+1

Zillow的有一個API [鏈接到Zillow的API(https://www.zillow.com/howto/api/APIOverview.htm)他們可能不想讓你刮他們的網站。你應該使用API​​。您收到的錯誤可能與Apps Script沒有任何關係。如果是這樣的話,你將無法用不同的代碼來解決這個問題。你需要知道什麼是正確的URL。這是Zillow特有的問題,而不是Apps腳本。 –

回答

0

這將在視圖中找到該圖像的img行作爲該URL的源。我只是做了UltraEdit。

<img src=".*?"