2010-06-16 77 views
0

我開始一個項目,並想知道圖像中的字符與圖像所在的整個網頁之間的關係。抓取圖像,整個網頁並緩存它們

我想抓取一些圖像及其網頁。我需要將抓取結果保存在本地磁盤中以供進一步分析。我想知道這個問題是否有開放源代碼?

+0

我知道這是一個古老的線程,但圖像爬行合法嗎?我想從網站上使用一些抓取的圖像,這些圖像具有可訪問和可下載的圖像,因此不會使用「黑客」來獲取圖像。該網站在圖片上也沒有版權標記。我可以重用這些圖像嗎? – Coder 2016-03-23 12:55:59

回答

0

您可以使用crawler4j用於此目的。這是一個簡單的Java爬蟲程序,可以在幾分鐘內配置,並且您還可以將它用於爬取圖像。您還可以在源代碼中找到ImageCrawler示例。