2011-05-25 81 views
1

我工作的公司將其前端切換到gwt應用程序,我想知道是否有可能編寫一個腳本(無論是與bash和wget或cURL,或Java或其他),使我下載gwt web應用程序的實際內容。因爲現在如果我嘗試使用諸如wget之類的命令,我只是使用一些javascript函數下載頁面,但沒有實際的頁面內容(我感興趣的內容)。我在質量保證方面,所以我想我很想知道是否有可能在沒有直接訪問開發者代碼的情況下執行這樣的任務。 謝謝!下載網頁谷歌網絡工具包

回答

0

我發現用一種叫做硒工具的解決方案。我能夠輕鬆點擊應用程序中的gwt應用程序記錄我的活動以供將來使用,並獲取應用程序生成的實際html,然後我可以解析所需內容並據此採取相應措施。唯一的小缺點是硒不需要使用htmlunit或httpunit,而需要使用瀏覽器。

1

GWT使用javascript構建頁面(DOM)。所以喲需要渲染初始DOM的東西,運行改變/生成元素的javascript,然後輸出整個DOM。基本上你需要一個瀏覽器。

你最好的選擇是尋找一個保存整個頁面的瀏覽器擴展。

0

以下是關於AJAX應用程序中的可爬行性的一般背景。

http://code.google.com/web/ajaxcrawling/docs/getting-started.html

這裏是通過餵養頁面到的HtmlUnit,導致所有的HTML被渲染,然後把結果發回給網絡爬蟲實現了爬行規範樣本servlet代碼。

http://code.google.com/p/google-web-toolkit/source/browse/branches/crawlability/samples/showcase/src/com/google/gwt/sample/showcase/server/CrawlServlet.java?r=6211

+0

感謝您的回覆,我之前實現了HTMLUnit代碼,嘗試從我正在測試的應用程序生成html,但它不生成應用程序的任何實際body html,它只是返回頭部提及的內容javascript和css引用。我需要再看看這個,看看我是否可以調整服務器請求或類似的東西。我相信這是可以做到的,因爲使用螢火蟲我可以查看應用程式的HTML,我只是沒有想出HTMLUnit。 – mike 2011-06-03 16:06:46