我已經禁止某些使用robots.txt的頁面用於所有搜尋器。我是否必須爲這些文件編寫元標記,否則網絡爬蟲只會跳過它們,因此不需要這樣做?robots.txt不允許屬性
0
A
回答
1
你很好走。所有的大搜索引擎(谷歌,真的)都服從你在robots.txt
中的任何條目。 http://www.robotstxt.org/robotstxt.html
此外,請注意robots.txt
文件本身是可見的,因此不要將其用作安全措施。 http://www.cre8asiteforums.com/forums/index.php?showtopic=55546
1
寫得很好的機器人會忽略這些頁面(前提是robots.txt的語法是正確的)。
2
如果你想限制爬行器服從robots.txt,那麼你很好,但如果它沒有那麼你可能會擰緊,因爲它很可能會忽略meta。
所有主要的搜索引擎抓取工具都會遵從它,所以你可能沒問題。
相關問題
- 1. Gmail不允許margin屬性
- 2. Robots.txt允許子文件夾,但不允許子文件夾
- 3. Robots.txt不允許subdirectoy,但允許在該文件夾
- 4. robots.txt的:不允許子目錄,但允許目錄
- 5. robots.txt文件不允許選項
- 6. 允許UnsafeUpdates屬性
- 7. GeoJSON:FeatureCollection中允許屬性?
- 8. Typescript - 屬性的允許值
- 9. TinyMCE,允許數據屬性
- 10. Onclick屬性不允許在某一點
- 11. @Column(S)不允許在@ManyToOne屬性
- 12. 允許Html屬性找不到[AllowHtml]
- 13. 不允許自定義屬性
- 14. 允許和禁止在robots.txt文件中
- 15. 分配屬性只讀屬性不允許
- 16. 允許某些值的屬性,但不允許所有其他值
- 17. 錯誤403:Python上robots.txt不允許的請求
- 18. XML - xml:base屬性允許哪些值?
- 19. 查找Rails模型的允許屬性
- 20. java是否允許嵌套屬性?
- 21. 表格中允許的html屬性
- 22. firebase只允許設置某些屬性
- 23. 允許更新特定集合屬性
- 24. 允許更改屬性的類
- 25. 如何在XMLSchema中允許xml:lang屬性?
- 26. 陣列允許不允許
- 27. jQuery插件允許「class」屬性中的名稱/值屬性?
- 28. 允許/限制基於其他屬性的XML屬性
- 29. 正則表達式for robots.txt - 不允許在目錄內的東西,但不允許目錄本身
- 30. 添加訪問接口屬性允許的,但不是抽象屬性