我用wget'下載'一個網站。網絡抓取和robots.txt
的wget -r http://www.xyz.com
ⅰ)它返回一個的CSS文件,的.js文件,的index.php和圖像img1.jpg
ⅱ)但是,在xyz.com下有更多圖片。我輸入www.xyz.com/Img2.jpg因此
得到了一張圖片。
iii)但是index.php涉及單個圖像,即img1.jpg。
IV)的機器人文件伴隨着它包含禁止:
應在命令行中取得了什麼變化的情況下xyz.com返回的一切,這不是
在引用index.php,但在目錄中是靜態的。
沒有辦法知道服務器上有什麼資源存在於猜測之中。 – Quentin