2011-08-28 139 views
2

我想寫一個支持cookie存儲操作和會話的抓取程序。 Java無頭瀏覽器有兩種不同的實現。 HtmlUnit有更好的JavaScript支持和可能的HTML解析。但是是否有任何理由使用HttpUnit來實現爬蟲?HtmlUnit與HttpUnit的性能對比

+0

[cockies](http://www.urbandictionary.com/define.php?term=cockie)哈哈:))仔細打字的 –

+2

我懷疑你會發現任何性能比較。這些並不是針對速度進行優化的:他們的目標主要是實現不需要最高性能的單元測試。自己衡量,但網絡肯定會成爲瓶頸,而不是Java代碼。 –

+0

我爲我的應用程序使用HTMLUnit,我基本上通過禁用CSS,從源代碼中刪除Java applet和ActiveX來加速實施。 – Lee

回答

0

有一個相關的文章here,從一個HtmlUnit開發者。

它基本上說,除了Javascript的支持,HtmlUnit是更高層次的HttpUnit。 HtmlUnit似乎也更加積極地開發(2014年有2個版本,而HttpUnit自2008年以來未更新)。