我已經多次使用scrapy和美麗的湯,但是更容易和更快速地找到kimonolabs解決方案。唯一的問題是,有時候作業需要一些調整,這是不可能的(例如,使用獨特模式進行爬取)。是否有像KimonoLabs這樣的刮板應用程序?
是否有其他解決方案將易用性和可選複雜性結合起來?主要是我想用一個WYSIWYG接口定義一個頁面抓取模板,然後以編程方式編寫抓取器。
我已經多次使用scrapy和美麗的湯,但是更容易和更快速地找到kimonolabs解決方案。唯一的問題是,有時候作業需要一些調整,這是不可能的(例如,使用獨特模式進行爬取)。是否有像KimonoLabs這樣的刮板應用程序?
是否有其他解決方案將易用性和可選複雜性結合起來?主要是我想用一個WYSIWYG接口定義一個頁面抓取模板,然後以編程方式編寫抓取器。
完全披露:我是ParseHub的創始人之一。
ParseHub試圖解決這個問題。它爲您提供了一個gui和強大的工具,用於直觀地定義模板,如果您需要更細緻的控制,則可以回到javascript的子集。所有您熟悉的編程原語(如果,打破,遞歸等)都可用。
您可以在www.parsehub.com
使用的Import.io提取找到它。
看起來不錯,我會很樂意給它一個嘗試,但我在OSX :( – user2808117 2016-02-28 00:31:39
將隆重推出REST API和門戶網站即將推出可以在任何操作系統上工作,在網站上註冊並且所有用戶都將獲得發送的電子郵件:) – 2016-02-28 03:53:13