嘿,我正在尋找一些水晶HTML解析庫。與紅寶石nokogiri類似的東西。我有一個工作正則表達式,但寧願一個HTML解析庫,因爲HTML +正則表達式==不好。謝謝。是否有任何HTML解析庫?
2
A
回答
4
Crystal標準庫中的標準方式是XML.parse_html
。這會給你一個XML::Node
,它有一個非常漂亮的界面。
如果需要使用CSS選擇器,你可以使用Crystagiri,雖然本來我沒有看到過STDLIB的發行多少好處。
2
0
我是Crystagiri的創建者。這是水晶的HTML解析器庫(如驚人Nokogiri紅寶石寶石,我不會假裝說Crystagiri做多的引入nokogiri,但你可以用它來使用CSS選擇器
婁一個基本的例子:。
require "crystagiri"
doc = Crystagiri::HTML.from_url "http://example.com/"
puts doc.css("li > strong.title") { |tag| puts tag.node}
# => <strong class="title"> .. </strong>
# => <strong class="title"> .. </strong>
由於水晶郎,Crystagiri是三個時間比Nokogiri快(accroding到我的測試)。
相關問題
- 1. 是否有任何雅司法的HTML解析器?
- 2. 是否有任何良好的.Net解析庫?
- 3. 在PHP(庫)中是否有任何好的iCal&vCal解析器?
- 4. PHP HTML解析器(是否沒有好的HTML解析器)
- 5. Java org.w3c.dom:是否有Java解析器庫?
- 6. 是否有解析AutoCAD文件的庫?
- 7. 是否有任何ePub庫
- 8. 是否有任何VBScript庫?
- 9. C#中是否有任何連接字符串解析器?
- 10. 是否有任何.pas文件(Delphi或Pascal)解析器?
- 11. 是否有任何PHP DocBlock解析器工具可用?
- 12. TSPLIB和/或SAT格式是否有任何Prolog解析器?
- 13. 在Java中是否有任何可用的SMS Pdu解析器?
- 14. 在C#中是否有任何multipart/form-data解析器 - (NO ASP)
- 15. 是否有任何用Javascript編寫的開源JSDoc解析器?
- 16. 是否有HTML HTML解析器的人類文本語法?
- 17. .net中是否有任何內置支持或本機庫來解析html文件?
- 18. 是否使用htmlentitiesdecode渲染/解析HTML?
- 19. 使用html5lib解析任何HTML到XML
- 20. 是否有解析/格式化TCP數據包的庫或任何有助於實現它的庫?
- 21. 是否有任何MVVM庫實現CommandSinkBinding?
- 22. 是否有任何Delphi XE2樣式庫?
- 23. ASP.Net是否有任何反XSS庫?
- 24. FORTRAN是否有任何開源ODBC庫?
- 25. 是否有任何Mongoose驗證庫?
- 26. SCons是否有任何庫/框架?
- 27. J2ME是否有任何PDF庫?
- 28. .NET中是否有任何DECAPTCHA庫?
- 29. 是否有任何C++ XSLT庫?
- 30. Android是否有任何bit.ly庫?
心不是引入nokogiri晶兼容? – marmeladze
@marmeladze沒有Ruby庫是你不能使用Java同樣的方式「水晶兼容」來自JavaScript的圖書館,它們是完全不同的語言, – RX14
https://github.com/veelenga/awesome-crystal#htmlxml-parsing –