我需要在Python中創建用於在發生更改時監視網站的軟件。目前我有定期任務,並檢查以前版本的網站內容。有沒有更簡單的方法來檢查網站內容是否已更改,可能是最後一次更改的時間,以避免下載內容時間?獲取網站上的最後更改
0
A
回答
4
您可以使用HEAD
HTTP方法,並在實際再次下載完整內容之前查看Date-Modified
和ETag
標題等。
然而,沒有什麼能保證當實體的(URL)內容發生變化時,服務器實際上會更新這些標頭,或者甚至可以正確地響應HEAD
方法。
1
儘管它沒有回答你的問題,但我認爲值得一提的是,你不必存儲以前版本的網站來查找更改。你可以計算它的總和md5
並存儲這個總和,然後計算它的新版本並檢查它們是否相等。
關於這個問題本身,AKX給了一個很好的答案 - 只要找到Date-Modified
標題,但記住它不能保證工作。
相關問題
- 1. Python - 獲取獨特的網站更改
- 2. 獲取最後更改日期在SQL
- 3. 更改網站上顯示的文字
- 4. 如何在我的網站上獲取最新的推文?
- 5. 獲取網站
- 6. 獲取網站
- 7. 在網站上獲取最新的訪問者
- 8. 如何獲取網站在Twitter上發佈的最新新聞
- 9. 更改網站網址
- 10. Googlebot 404在網站更改後抓取錯誤
- 11. 如何獲取c#網頁的最後修改日期?
- 12. 從外部網站獲取數據,然後修改它
- 13. 更改Joomla網站上的域名,並自動更改鏈接?
- 14. 獲取Java中的AS400 DDS文件的最後更改日期
- 15. 獲取用戶名在Joomla網站中更改
- 16. 更改Powershell腳本以將網站從IIS獲取到Azure
- 17. 獲得最後的變化,因爲最後一個值更改
- 18. 如何獲取django-simple-history中最後更改的對象?
- 19. 使用vb.NET獲取xml文件的最後更改日期
- 20. 獲取從網站
- 21. 獲取DLL的最後更新日期
- 22. Ruby on Rails:更改後的視圖,網站不更新
- 23. 在DNN網站上獲取錯誤
- 24. 在localhost網站上獲取訪問者
- 25. 在網站上獲取鏈接
- 26. 如何在網站上獲取Google Sitelinks?
- 27. 從網站上讀取最後一行,不保存磁盤上的文件
- 28. 如何獲取Windows上Perl目錄的最後修改時間?
- 29. 如何獲取上傳文件的最後修改日期?
- 30. HashMap的值更改後「獲取」
謝謝,我現在正在使用散列,但我需要下載內容以提供新的散列來與舊的進行比較,但問題在於內容太長時,我會監視很多網站。 – Damir 2012-03-16 14:03:31