scraperwiki

    4熱度

    1回答

    用戶從刮板運行中獲取此消息。 Run succeeded: - ran 1 times, most recently for 2073 seconds (288 scraped pages, 2 records) 17:45, 5 May 2011 Hide Details EXECUTIONSTATUS: uml=uml003

    2熱度

    1回答

    任何人都知道如何使用代理鍵創建表?尋找 類似於自動增量,這只是一個大整數, 會自動將下一個最高唯一編號添加爲主鍵。 需要知道如何創建表以及如何添加記錄 (最好通過scraperwiki.sqlite.save) 謝謝!

    0熱度

    2回答

    我一直在使用ScraperWiki和昨天的實驗,我可以得到DOM中所有li的列表。但是,現在我只經歷了一次迭代。 這是我的代碼 $html = 'www.blah...' $dom = new simple_html_dom(); $dom->load($html); print_r('Starting parse'); $events = $dom->find("ul.listing l

    1熱度

    2回答

    我有scraperwiki一個非常簡單的Python腳本: import scraperwiki import lxml.html html = scraperwiki.scrape("http://www.westphillytools.org/toolsListing.php") print html 我沒有寫任何東西來分析它尚未......現在我只想HTML。 當我在編輯模式下運

    0熱度

    1回答

    這是我第一次這樣做,所以我最好爲我的菜鳥錯誤提前道歉。我試圖通過搜索狀態中的第一個和最後一個名字來爲legacy.com搜索首頁結果。我是新手編程,並使用scraperwiki來執行代碼。它很有效,但在10,000個ish查詢有時間處理之前,我耗盡了CPU時間。現在我試圖保存進度,在時間不足的時候趕上,然後從停止的地方恢復。 我無法保存工作,任何與其他部分的幫助也將不勝感激。到目前爲止,我只是抓住

    4熱度

    1回答

    scraperwiki如何決定停止預定運行?它是基於實際執行時間還是CPU時間?或者也許別的東西。 我颳了一個站點,其中Mechanize需要30s來加載每個頁面,但我使用很少的CPU來處理頁面,所以我想知道服務器的緩慢是否是一個主要問題。

    0熱度

    1回答

    我在ScraperWiki上使用以下代碼來搜索特定哈希標籤的Twitter。 它工作得很好,正在挑選推文中提供的任何郵政編碼(如果沒有可用的郵件,則返回虛假)。這是通過data['location'] = scraperwiki.geo.extract_gb_postcode(result['text'])行來實現的。 但我只是隻有對包含郵編信息的推文感興趣(這是因爲它們將在稍後階段添加到Goog

    6熱度

    2回答

    我想湊英國食品評級機構數據ASPX SEACH結果頁面上scraperwiki(http://scraperwiki.com/scrapers/food_standards_agency/)使用機械化/ Python的,但拿出一個(E,G http://ratings.food.gov.uk/QuickSearch.aspx?q=po30)。問題當試圖按照其具有的形式是「下一個」頁面鏈接: <in

    0熱度

    1回答

    有沒有辦法刪除scraperwiki上的視圖?我無法在網站的任何位置找到方法。

    7熱度

    1回答

    scraperwiki python模塊是否可用於在Scraperwiki.com Web界面之外進行安裝?它看起來像source可用,但沒有打包。