2010-07-29 60 views

回答

5

你可以看到谷歌(仍然)使用site知道一個網站限制:

http://www.google.com/search?q=site:[domain] 

您還可以檢查出Internet Archive

(在這兩種情況下,你可能想要做一些重型自動化獲取數千頁。)

+0

我打算使用Warrick:http://warrick.cs.odu.edu/ 但是,唉,它的服務器太忙了。 Internet Archive在6個月後保存。 – stockoverflow 2010-08-08 17:20:37

10

我創建了一個free service to recover your website可以檢索從搜索引擎的緩存的網頁中。

該服務的輸出是一個帶有來自搜索引擎緩存的HTML的壓縮文件。它仍處於測試階段,因此它仍然需要很多調整和錯誤修正,但希望它可以幫助您或其他遇到同樣問題的人。

更新:我沒有時間繼續開發服務,因此它關閉。

+1

列出的網站是一個無效鏈接:( – NickG 2015-08-12 17:45:58

+1

如果你的github源代碼= O – dctremblay 2017-03-09 04:01:37