我想創建一個網絡蜘蛛,能夠從其他網站獲得一些有用的信息。 我如何從網站獲取文件並存儲到我的服務器? 例如: 該文件的網址是http://www.abc.com/attachment.php?aid=abc 我如何讓我的網站的用戶下載文件時不顯示頁面http://www.abc.com/attachment.php?aid=abc?asp.net(網絡蜘蛛)
0
A
回答
0
0
有很多方法可以去做。
WebClient
類可用於獲取網頁資源,例如網頁。
如果你想抓取一個網站,你還需要解析內容,以便跟蹤鏈接並下載圖像和其他資源(CSS,Javascript等......) - 我建議使用一個解析器,如HTML Agility Pack解析HTML以便您可以查詢這些資源(您可能還想使用WebClient
下載)。
相關問題
- 1. 阻止網絡蜘蛛
- 2. 網絡蜘蛛需要的幫助
- 3. 製作網絡爬蟲/蜘蛛
- 4. Python網絡蜘蛛:如何解決captcha?
- 5. 建議想:網絡蜘蛛用Perl
- 6. Nutch網絡蜘蛛,索引整個網絡
- 7. 蜘蛛不爬行網頁
- 8. 最佳網站蜘蛛?
- 9. 如何繪製蜘蛛網
- 10. 減慢蜘蛛網址
- 11. php擴展名「PCNTL」適用於網絡蜘蛛嗎?
- 12. 網絡蜘蛛如何抓取::之前的內容?
- 13. Ruby網絡蜘蛛和搜索引擎庫
- 14. 有人可以建議一個網絡蜘蛛嗎?
- 15. 使用多線程來改進網絡爬蟲/蜘蛛
- 16. 當建立一個網絡蜘蛛,你應該使用遞歸?
- 17. Python的網絡爬蟲(NameError:名字「蜘蛛」沒有定義)
- 18. 在使用scrapy製作的網絡爬蟲中調用另一個蜘蛛的一個蜘蛛
- 19. Python的scrapy蜘蛛
- 20. 佈局像蜘蛛
- 21. Scrapy DOMAIN_NAME的蜘蛛
- 22. Scrapy與Scrapy蜘蛛
- 23. 未知的ZAP蜘蛛網結果
- 24. Scrapy - 蜘蛛抓取重複網址
- 25. 從蜘蛛(Scrapy)無法獲取網址
- 26. JQuery中的蜘蛛網圖表
- 27. 在「蜘蛛網」內獲取矩形?
- 28. Highcharts蜘蛛網圖表調用series.setData
- 29. 附表scrapyd蜘蛛和蜘蛛通過配置選項
- 30. Web蜘蛛與Wget的蜘蛛有什麼不同?