2015-02-09 61 views
0

我使用JSOUP複製這樣的網頁:如何包含所有HTML,腳本和CSS整個網頁複製的Java

public String fetch(String url1) { 
    try { 
     Document doc = Jsoup.connect(url1).get(); 
     String document=doc.toString(); 
     Elements links = doc.select("link"); 
     Elements scripts = doc.select("script"); 
     for (Element element : links) { 
      document += element.absUrl("href"); 
     } 
     for (Element element : scripts) { 
      document += element.absUrl("src"); 
     } 
     return document; 
    } 
    catch (Exception exc) { 
     return ""; 
    } 
} 

但它只是獲取HTML內容,而應該取HTML,CSS和腳本。

回答

0

您正在迭代linkscript元素,並且基本上將它們的URL(分別爲hrefsrc屬性)添加到輸出。

相反,我認爲你應該遞歸調用fetch來添加這些URL的內容

請注意,這本身不會生成可行的HTML文檔,因爲您不能像這樣內聯CSS和腳本。

相關問題