2010-06-17 39 views
1

我已經在Perl中編寫了一個爬蟲程序,並且它非常簡單,給出了libwww-perl的高級功能。它實際上非常直截了當,它可以接受一個請求的原始HTML響應,並從該頁面上的FORMs爲您創建下一個HTTP請求(就像它將爲您解析HTML一樣)。.NET或Java中的libwww-perl的等效代碼

有沒有人知道任何類似於.NET或Java的庫?

硒是毫無疑問的,因爲它需要瀏覽器是開放的,我們不能在我們的實施適應)

回答

0

HtmlUnit是相當不錯的,不需要單獨的瀏覽器。