2010-08-15 49 views
15

我在我的網站上創建了兩個非常相似但用於不同目的的頁面。一個是感謝用戶留言,另一個是鼓勵用戶訂閱。如何拒絕來自robots.txt的特定頁面

我不想重複的內容,但我希望頁面可用。我可以設置網站地圖來隱藏一個嗎?我會在robots.txt文件中執行此操作嗎?

將不允許看起來是這樣的:

不允許:/可溼性粉劑管理員

我將如何自定義到一個特定的頁面,如:

http://sweatingthebigstuff.com/thank-you-for-commenting

回答

28
Disallow: /thank-you-for-commenting 

機器人.txt

看看last.fm robots.txt file獲取靈感。

+10

我很欣慰有人有先見之明,不允許傷害人類。 – starsinmypockets 2011-04-20 02:12:07

+0

對人類的傷害可能是機器人的陷阱。 – 2014-12-04 20:41:19

+0

這肯定會遭受誤報,因爲標準說「任何以此值開頭的URL都不會被檢索」。 – ChrisJJ 2016-09-29 23:19:17

0

這很簡單,任何你想禁止的頁面,只是給這個文件或文件夾的根url。 只需將其放入您的robots.txt文件即可。

Disallow: /thank-you-for-commenting 
1

的robots.txt文件中使用正則表達式匹配的網頁,因此,避免指定更多的頁面比你打算,你可能需要一個$添加到頁面名稱末尾:

Disallow: /thank-you-for-commenting$ 

如果你不這樣做,你也會禁止頁面/感謝您對此發表評論

1

您還可以在robots.txt文件中添加一個帶擴展名的特定頁面。在進行測試的情況下,您可以指定測試頁面路徑以禁止漫遊機器人。

對於實施例:

Disallow: /index_test.php 
Disallow: /products/test_product.html 
Disallow: /products/  

第一個Disallow: /index_test.php將從根文件夾爬行測試頁禁止機器人。

第二個Disallow: /products/test_product.html將不允許test_product.html文件夾下的產品。

最後,最後一個示例Disallow: /products/將禁止整個文件夾進行爬網。