我試圖從我的大學的一個網站上抓取數據,該網站使用Shibboleth作爲身份驗證/保護的一種形式。但是,我很難確定通過它的最佳方式以及我想要抓取的頁面。我有有效的憑據,我可以使用它登錄。有沒有人有任何建議如何完成這項任務?如何從受Shibboleth保護的網站上抓取數據?
1
A
回答
0
你可以用機械化來提交表單並登錄到網站:http://wwwsearch.sourceforge.net/mechanize/
0
我相信ECP輪廓是設計的非瀏覽器客戶端(即命令行)訪問Shibboleth的受保護的資源
嘗試一個Shibboleth wiki頁面上提供的示例客戶端我上面鏈接的
0
您也可以嘗試Apache JMeter,只記錄您的操作,製作一些腳本(並非如此簡單shibboleth),您可以自動訪問此頁面。
[編輯 - 更好的解決方案] 我相信在Shibboleth文檔頁面是scripts磨牀(另一個負載測試工具)。這個測試計劃實際上應該很容易修改和用於你的目的的Python(ok Jython)腳本
1
我一直在研究腳本Shibbolized登錄成功(在我的情況下,爲了監視Shibboleth IdP及其保護的應用程序)。
我使用Python的urllib
模塊及其類來處理重定向跟隨和cookie傳遞(用於Shibboleth)和登錄表單發佈。經過一些修改後,urllib可以讓您通過Shibbolized登錄成功。您可以使用這種方法來處理Shibbolized網站的初始登錄,然後通過直接使用Python的urllib
來處理這個問題。
相關問題
- 1. 如何從網站上抓取數據
- 2. 如何從受密碼保護的https網站查詢數據
- 3. 如何保護我的網頁上某些數據的抓取?
- 4. 如何從使用Java的網站中提取受登錄保護的數據?
- 5. Php從網站上抓取數據
- 6. 網站上受保護的CSS?
- 7. 如何從網頁上抓取數據?
- 8. 如何使用Jaunt庫從網站上抓取數據?
- 9. 我如何從Python網站抓取網站上的pdf鏈接
- 10. 如何保護網站免受xss(跨網站腳本)
- 11. 如何從抓取工具獲取數據到我的網站?
- 12. 從受密碼保護的網站讀取信息
- 13. 屏幕從網站抓取數據
- 14. 從網站抓取XML文件數據
- 15. 未受SSL保護的網站
- 16. 受登錄保護的網站部分
- 17. 網絡抓取密碼保護網站使用R
- 18. 如何存儲從網站抓取的數據
- 19. 從scrapy網站上抓取數據並輸出到javascript
- 20. 使用IMPORTXML從網站上抓取數據
- 21. PHP:連接中止,同時從網站上抓取數據
- 22. 我如何從R網站抓取這個網站的信息?
- 23. 如何在網站上抓取動態內容並保存?
- 24. 如何保護我的網站免受會話固定?
- 25. 如何保護我的網站免受瘙癢?
- 26. 如何保護我的網站免受注射(Cookie編輯)
- 27. 保護網站
- 28. OWASP ZAP可以在受保護的網站上執行嗎?
- 29. VBA從ddos下載文件受保護的網站
- 30. 如何從JSF網站上抓取Ajax生成的內容?
也許你應該谷歌,並保持你的自我 – Ibu 2011-05-25 04:07:14
@Ibu爲什麼?他不問如何繞過安全,只是如何以編程方式登錄。 – 2011-05-25 04:09:12