如何獲得給定基址地址的URL地址的所有擴展名？

例如，讓我們說有一個叫www.blabla.com

還有另一個頁面www.blabla.com/blabla2.html網站。

有沒有辦法從www.blabla.com知道www.blabla.com/blabla2.html？

2013-12-14 Aboria

我想你要找的是一個網絡爬蟲：https://en.wikipedia.org/wiki/Web_crawler

在高層次上，您請求的基本頁面，然後要求所有的頁面上鍊接的網頁。繼續這個過程應該產生網站上引用的所有URL。但是，如果www.blabla.com/blabla2.html是真實網頁，但實際上從未鏈接到網站上，則此過程無法找到它。

2013-12-14 06:17:32 thesquaregroot

不，這是不可能的。因爲主域後面的名稱大多是虛擬的。意味着該名稱後面的資源不能是具體文件或具體網頁

只有至少訪問過每個網址一次，您才能知道它。比其他答案提到的WebCrawler更有意義。

我的回答也意味着現在有惡意軟件檢查什麼是布萊恩。

看看Unix的wget。這提供了很好的可能性。

2013-12-14 06:17:46 Diversity

用於培養wget的+1。維基百科對它的功能和注意事項有一個非常好的描述：https://en.wikipedia.org/wiki/Wget#Recursive_download – thesquaregroot

@thesquaregroot thx爲你達成一致。你給我的鏈接對我來說很好，特別是它的名字。即使我不認爲它在安全的網絡中正常工作。 – Diversity

回答