我想用ruby/rails從網站上覆制一些特定的內容。 我需要的內容是在一個marquee html標籤內,除以div。 如何使用ruby訪問此內容? 更確切地說 - 我想使用某種紅寶石gui(最好是鞋子)。 我該怎麼做?如何使用Ruby/Rails從網站獲取內容?
2
A
回答
1
這是不是一個真正的Rails的問題。這是你使用Ruby做的事情,然後可能使用Rails或Sinatra或Padrino顯示 - 挑選你的毒藥。
有幾種不同的HTTP客戶端可以使用:
開URI帶有Ruby和是最容易的。 Net :: HTTP隨附Ruby,是標準工具箱,但是它的層次較低,所以你需要做更多的工作。 HTTPClient和Typhoeus + Hydra能夠進行線程化並具有高級和低級接口。
我推薦使用Nokogiri來解析返回的HTML。它功能非常全面和強大。
require 'nokogiri'
require 'open-uri'
doc = Nokogiri::HTML(open('http://www.example.com'))
puts doc.to_html
如果需要通過登錄畫面中進行導航或填寫表格,你得到你需要解析頁面之前,那麼我建議你看機械化。它在內部依賴於Nokogiri,所以你可以要求它獲得一個Nokogiri文檔,並在Mechanize獲取所需的URL後解析掉。
如果您需要處理動態HTML,請查看各種WATIR工具。他們駕駛各種網頁瀏覽器,然後讓您訪問瀏覽器所看到的內容。
一旦你有了你想要的內容或數據,你就可以在Rails頁面中「重新調整」它的內容。
1
如果我要正確理解,你需要一個GUI界面的網站刮板。如果是這樣,你可能必須自己建造一個。
刮一個網站最簡單的方法是使用nokogiri或機械化寶石。基本上,您將爲這些庫提供該網站的地址,然後使用其XPath功能從DOM中選擇文本。
相關問題
- 1. 如何使用Jsoup從網站獲取內容
- 2. 如何使用SSL(HTTPS)來獲取網站使用HTTPS內容
- 3. 從Flash網站獲取內容
- 4. 從外部網站獲取內容?
- 5. 從python網站獲取json內容
- 6. 如何使用php獲取網站內容
- 7. 從QWebView使用Qt 5.5.1獲取網站的內容
- 8. 使用jQuery(跨域)從其他網站獲取所有內容
- 9. 如何使用AlchemyAPI從網站上刮取內容?
- 10. 如何從其他網站獲取內容
- 11. 如何從網站獲取JavaScript動態內容
- 12. 如何從Umbraco中的當前其他網站獲取內容?
- 13. QT4未完成獲取網站內容
- 14. 通過PHP獲取網站內容
- 15. 從登錄網站獲取網址內容
- 16. 如何使用其他網站內容自動更新網站?
- 17. 如何獲取使用PHP/cURL調用JSON文件的網站內容
- 18. SharePoint如何獲取所有子網站,子網站列表和列表內容
- 19. 網站內容抓取
- 20. 爲什麼我無法使用CURL獲取網站內容
- 21. 使用C++獲取HTTPS網站內容QNetworkRequest
- 22. 如何使用批處理腳本讀取網站的內容?
- 23. 如何獲取嵌入在網站上的Flash中的內容?
- 24. 如何獲取joomla網站中的內容
- 25. 如何通過一些參數獲取網站內容?
- 26. 如何從網站內使用Spacy NLP
- 27. 如何使用PowerShell獲取網站HostHeader
- 28. 動態網站,使用include來獲取特定div中的內容,如何?
- 29. 使用LWP獲取網頁內容
- 30. 從網站閱讀內容
你想完成什麼?你想刮另一個網站,並將內容插入數據庫?你只是想在用戶界面中顯示一些遠程內容嗎? – Intelekshual 2011-03-09 18:44:06