2011-05-23 64 views
2

我可以使用Java(使用URL和BufferedReader類)通過http(例如,http://www.foo.com)讀取HTML內容。但是,其中幾個包含JavaScript。我當前的應用程序無法處理JavaScript。使用Java讀取HTML + JavaScript

使用Java使用JavaScript閱讀HTML內容的最佳方式是什麼?

如果更容易,我使用其他語言打開。

在此先感謝您的幫助。

UPDATE - 澄清:

一對夫婦HTML內容使用JavaScript動態生成的。在瀏覽器上查看結果時,我可以看到結果(在JavaScript處理後以純HTML格式)。

另一方面,當我的Java應用程序檢索到HTML內容時,它說我的應用程序沒有JavaScript。

理想情況下,我希望能夠使用我的Java應用程序獲得與瀏覽器相同的結果。

感謝大家的迴應。

+2

在閱讀URL後,您對URL返回的內容做了什麼?你在評估JavaScript嗎? – 2011-05-23 19:51:54

+0

不確定我是否正確理解你的問題。您可以使用[SWT瀏覽器窗口小部件](http://www.eclipse.org/articles/Article-SWT-browser-widget/browser.html)。它可以呈現HTML並支持JavaScript。 – 2011-05-23 19:53:33

+0

@pion你的意思是「它說我的應用程序沒有JavaScript」。誰說的 ?它是否包含這個確切文本的HTML?然後,您應該考慮修改您的用戶代理字符串以首先獲取正確的內容。 HTMLUnit可以爲你提供幫助,絕對是最好的選擇。 – Grooveek 2012-01-04 09:42:49

回答

0

眼鏡蛇(http://lobobrowser.org/cobra/getting-started.jsp)將滿足您的需求

0

對於剛剛HTML解析,您可以使用HTMLParser(org.htmlparser)。然而,從描述問題的方式來看,您似乎需要一個瀏覽器,因爲執行與解析完全不同。乾杯。