我在我的網站上創建了兩個非常相似但用於不同目的的頁面。一個是感謝用戶留言,另一個是鼓勵用戶訂閱。如何拒絕來自robots.txt的特定頁面
我不想重複的內容,但我希望頁面可用。我可以設置網站地圖來隱藏一個嗎?我會在robots.txt文件中執行此操作嗎?
將不允許看起來是這樣的:
不允許:/可溼性粉劑管理員
我將如何自定義到一個特定的頁面,如:
http://sweatingthebigstuff.com/thank-you-for-commenting
我在我的網站上創建了兩個非常相似但用於不同目的的頁面。一個是感謝用戶留言,另一個是鼓勵用戶訂閱。如何拒絕來自robots.txt的特定頁面
我不想重複的內容,但我希望頁面可用。我可以設置網站地圖來隱藏一個嗎?我會在robots.txt文件中執行此操作嗎?
將不允許看起來是這樣的:
不允許:/可溼性粉劑管理員
我將如何自定義到一個特定的頁面,如:
http://sweatingthebigstuff.com/thank-you-for-commenting
這很簡單,任何你想禁止的頁面,只是給這個文件或文件夾的根url。 只需將其放入您的robots.txt文件即可。
Disallow: /thank-you-for-commenting
的robots.txt文件中使用正則表達式匹配的網頁,因此,避免指定更多的頁面比你打算,你可能需要一個$添加到頁面名稱末尾:
Disallow: /thank-you-for-commenting$
如果你不這樣做,你也會禁止頁面/感謝您對此發表評論
您還可以在robots.txt文件中添加一個帶擴展名的特定頁面。在進行測試的情況下,您可以指定測試頁面路徑以禁止漫遊機器人。
對於實施例:
Disallow: /index_test.php
Disallow: /products/test_product.html
Disallow: /products/
第一個Disallow: /index_test.php
將從根文件夾爬行測試頁禁止機器人。
第二個Disallow: /products/test_product.html
將不允許test_product.html文件夾下的產品。
最後,最後一個示例Disallow: /products/
將禁止整個文件夾進行爬網。
我很欣慰有人有先見之明,不允許傷害人類。 – starsinmypockets 2011-04-20 02:12:07
對人類的傷害可能是機器人的陷阱。 – 2014-12-04 20:41:19
這肯定會遭受誤報,因爲標準說「任何以此值開頭的URL都不會被檢索」。 – ChrisJJ 2016-09-29 23:19:17