2011-11-18 86 views

回答

3

在您的HTTP根目錄下創建一個robots.txt文件。如果您有一個網站http://domain.com,請將robots.txt放在您可以加載它的地方http://domain.com/robots.txt

User-agent: * 
Disallow: /somewhere_i_dont_want_google_to_crawl.php 
Disallow: /dont_crawl_this_directory/ 

這裏是堆棧溢出網站上真正的實用example

+0

謝謝。 「HTTP根」在哪裏?我如何檢查它是否實際生效? – neversaint

+1

我做了一個編輯並予以澄清。 Google有一篇關於robots.txt的文章:http://www.google.com/support/webmasters/bin/answer.py?hl=zh_CN&answer=156449&from=35237&rd=1 – Deltik

1

結帳離開robots.txt file

但不這樣做在whitehouse.gov白癡管理員在他們想保守祕密

哦,最後一件事,這個文件做的一切和列表 - 不信任它 - 它是「應該停止爬蟲」,但我不會成爲法律案件

2

您可以在您的HTTP根目錄中使用robots.txt,並且您還可以使用元標記(如果您的網頁爲HTML)來停止它太:

<meta name="googlebot" content="noindex" /> 

更多示例請參閱this website