2012-04-12 46 views

回答

0

從你的使用情況,您需要一個刮刀比一個清潔工。

清潔劑 - 通常很髒,不合格,不適合進一步處理。對於這些文件的任何嚴重消耗,首先必須清理混亂並將訂單帶到標籤,屬性和普通文本。

Scraper - 在語法上閱讀頁面並編輯html頁面。

http://sourceforge.net/projects/htmlscraper/

+0

的Html刮板正是我需要的,我會更多,因爲的HtmlUnit它們提供幀多有記載的情況下:http://htmlunit.sourceforge.net/frame-howto.html – Rick 2012-04-12 10:46:21