由於網絡爬蟲在沒有任何請求數據的情況下擊中我網站的某些部分,我收到了很多發送到我的電子郵件的錯誤,而且我想知道在Django中處理Web爬蟲的最佳方式是什麼?當我遇到空的QueryDict時,是否應該發出重定向?如何在Django中處理網絡爬蟲?
2
A
回答
1
您可以考慮實施robots.txt以禁止抓取工具訪問您的網站僅供人類使用的區域,例如表單。
-1
表現良好的爬網程序只能執行GET請求。表單應該只是GET請求。
Ruby和Rails使用CRUD映射
Create -> POST,
READ -> GET,
Update -> PUT,
Delete -> DELETE
唯一的東西,沒有額外的信息應該是GET請求。
1
我認爲你的意見應該適用於任何請求,在列表返回頁面上顯示消息「不正確的請求」。 500是醜陋的。您確定該用戶沒有請求數據沒有打開頁面嗎? QueryDict的「get」方法可以幫助使用默認值。
相關問題
- 1. 網絡爬蟲如何處理javascript
- 2. 網絡爬蟲
- 3. PHP網絡爬蟲
- 4. java網絡爬蟲
- 5. Python網絡爬蟲
- 6. 我如何處理JavaScript的一個Perl的網絡爬蟲?
- 7. 需要網絡爬蟲
- 8. 自動網絡爬蟲
- 9. 網絡爬蟲,反饋?
- 10. 網絡爬蟲不打印
- 11. 網絡爬蟲應用
- 12. 網絡爬蟲提取
- 13. 如何使網絡爬蟲更有效?
- 14. 在Scala中的網絡爬蟲算法
- 15. NodeJs網絡爬蟲文件擴展處理
- 16. 針對網絡爬蟲的Python線程或多處理?
- 17. 在android上的簡單網絡爬蟲?
- 18. 如何在java中創建網絡爬蟲?
- 19. 如何在java中創建網絡爬蟲
- 20. 是一個網絡爬蟲更合適?
- 21. 網絡爬蟲使用雙絞線
- 22. 識別敵對網絡爬蟲
- 23. 與Python 2.7.9分頁網絡爬蟲
- 24. 網絡爬蟲遇到什麼危險?
- 25. 錯誤使用C#網絡爬蟲
- 26. PHP與Python對於網絡爬蟲
- 27. 製作網絡爬蟲/蜘蛛
- 28. 網絡爬蟲和GET與POST請求
- 29. 網絡爬蟲產生輸出緩存
- 30. 網絡爬蟲更新策略
「表單應該只是GET請求」 - >那麼'
應該不鼓勵。查看Twitter的主頁並查看是否有任何GET表單。 – EnabrenTane 2010-12-18 20:49:36
我的履帶式拖拉機總是使用DELETE .../s – titaniumdecoy 2011-05-24 23:36:25