2011-09-08 29 views
0

更新:我將wget從1.10升級到1.12並解決了問題。wget訪問具有父目錄後的主機名的url

例如

www.example.com/level1/level2/../test.html

這樣,wget和瀏覽器將訪問

www.example.com/level1/test.html

但對於

www.example.com/../test.html

的wget將訪問

www.example.com/../test.html

瀏覽器將訪問

www.example.com/test.html

我正在使用wget解析某個網頁以獲取它的大小和其中的元素。 現在我發現有些網頁使用「../css/xxx.jpg」而不是「css/xxx.jpg」。 可以用瀏覽器訪問網頁,但不能用wget。

有沒有辦法解決它?謝謝。

回答

0

在將URL傳遞給wget之前,從路徑的尾部修剪「../」。 (將URL分成組件將有所幫助。)

如何做到這一點取決於您使用的是什麼語言或框架。

+0

網址在html文件中,wget會自動解析它們,所以我無法處理它。現在wget 1.12可以正確做到。 – Frank