2
我想寫一個支持cookie存儲操作和會話的抓取程序。 Java無頭瀏覽器有兩種不同的實現。 HtmlUnit有更好的JavaScript支持和可能的HTML解析。但是是否有任何理由使用HttpUnit來實現爬蟲?HtmlUnit與HttpUnit的性能對比
我想寫一個支持cookie存儲操作和會話的抓取程序。 Java無頭瀏覽器有兩種不同的實現。 HtmlUnit有更好的JavaScript支持和可能的HTML解析。但是是否有任何理由使用HttpUnit來實現爬蟲?HtmlUnit與HttpUnit的性能對比
有一個相關的文章here,從一個HtmlUnit開發者。
它基本上說,除了Javascript的支持,HtmlUnit是更高層次的HttpUnit。 HtmlUnit似乎也更加積極地開發(2014年有2個版本,而HttpUnit自2008年以來未更新)。
[cockies](http://www.urbandictionary.com/define.php?term=cockie)哈哈:))仔細打字的 –
我懷疑你會發現任何性能比較。這些並不是針對速度進行優化的:他們的目標主要是實現不需要最高性能的單元測試。自己衡量,但網絡肯定會成爲瓶頸,而不是Java代碼。 –
我爲我的應用程序使用HTMLUnit,我基本上通過禁用CSS,從源代碼中刪除Java applet和ActiveX來加速實施。 – Lee