我想從我的servlet中讀取給定URL的源代碼(HTML標籤)。如何從servlet獲取給定URL的來源?
例如,URL是http://www.google.com,我的servlet需要讀取HTML源代碼。爲什麼我需要這樣呢,我的網絡應用程序將會讀取其他網頁並獲取有用的內容並對其進行處理。
可以說,我的應用程序顯示一個城市中的一個類別的商店列表。如何生成該列表是,我的Web應用程序(servlet)通過給定的網頁顯示各種商店並閱讀內容。通過源代碼,我的servlet可以過濾該源代碼並獲取有用的詳細信息。最後創建列表(因爲我的servlet無法訪問給定URL的Web應用程序數據庫)。
任何知道任何解決方案? (特別是我需要這樣做的servlet)如果你認爲有另一種最好的方式來從另一個網站獲取詳細信息,請讓我知道。
謝謝
非常感謝您對SRINIVAS我們的代碼和信息。 –