如何拒絕來自robots.txt的特定頁面

我在我的網站上創建了兩個非常相似但用於不同目的的頁面。一個是感謝用戶留言，另一個是鼓勵用戶訂閱。如何拒絕來自robots.txt的特定頁面

我不想重複的內容，但我希望頁面可用。我可以設置網站地圖來隱藏一個嗎？我會在robots.txt文件中執行此操作嗎？

將不允許看起來是這樣的：

不允許：/可溼性粉劑管理員

我將如何自定義到一個特定的頁面，如：

2010-08-15 Daniel

Disallow: /thank-you-for-commenting

在機器人.txt

2010-08-15 06:43:32 AlexanderMP

+10

我很欣慰有人有先見之明，不允許傷害人類。 – starsinmypockets 2011-04-20 02:12:07

對人類的傷害可能是機器人的陷阱。 – 2014-12-04 20:41:19

這肯定會遭受誤報，因爲標準說「任何以此值開頭的URL都不會被檢索」。 – ChrisJJ 2016-09-29 23:19:17

這很簡單，任何你想禁止的頁面，只是給這個文件或文件夾的根url。只需將其放入您的robots.txt文件即可。

Disallow: /thank-you-for-commenting

2015-05-11 18:11:00

的robots.txt文件中使用正則表達式匹配的網頁，因此，避免指定更多的頁面比你打算，你可能需要一個$添加到頁面名稱末尾：

Disallow: /thank-you-for-commenting$

如果你不這樣做，你也會禁止頁面/感謝您對此發表評論

2017-06-08 03:12:55

您還可以在robots.txt文件中添加一個帶擴展名的特定頁面。在進行測試的情況下，您可以指定測試頁面路徑以禁止漫遊機器人。

對於實施例：

Disallow: /index_test.php 
Disallow: /products/test_product.html 
Disallow: /products/

第一個Disallow: /index_test.php將從根文件夾爬行測試頁禁止機器人。

第二個Disallow: /products/test_product.html將不允許test_product.html文件夾下的產品。

最後，最後一個示例Disallow: /products/將禁止整個文件夾進行爬網。

2017-10-06 03:28:00 Nikz

回答