scraperwiki

4熱度

1回答

用戶從刮板運行中獲取此消息。 Run succeeded: - ran 1 times, most recently for 2073 seconds (288 scraped pages, 2 records) 17:45, 5 May 2011 Hide Details EXECUTIONSTATUS: uml=uml003

2熱度

1回答

ScraperWiki：如何使用自動增量鍵創建和添加記錄

任何人都知道如何使用代理鍵創建表？尋找類似於自動增量，這只是一個大整數，會自動將下一個最高唯一編號添加爲主鍵。需要知道如何創建表以及如何添加記錄（最好通過scraperwiki.sqlite.save）謝謝！

0熱度

2回答

Foreach循環在一次迭代後死亡

我一直在使用ScraperWiki和昨天的實驗，我可以得到DOM中所有li的列表。但是，現在我只經歷了一次迭代。這是我的代碼 $html = 'www.blah...' $dom = new simple_html_dom(); $dom->load($html); print_r('Starting parse'); $events = $dom->find("ul.listing l

1熱度

2回答

爲什麼scraperwiki會忽略被刮掉的html行？

我有scraperwiki一個非常簡單的Python腳本： import scraperwiki import lxml.html html = scraperwiki.scrape("http://www.westphillytools.org/toolsListing.php") print html 我沒有寫任何東西來分析它尚未......現在我只想HTML。當我在編輯模式下運

0熱度

1回答

保存和恢復scraperwiki - CPU時間

這是我第一次這樣做，所以我最好爲我的菜鳥錯誤提前道歉。我試圖通過搜索狀態中的第一個和最後一個名字來爲legacy.com搜索首頁結果。我是新手編程，並使用scraperwiki來執行代碼。它很有效，但在10,000個ish查詢有時間處理之前，我耗盡了CPU時間。現在我試圖保存進度，在時間不足的時候趕上，然後從停止的地方恢復。我無法保存工作，任何與其他部分的幫助也將不勝感激。到目前爲止，我只是抓住

4熱度

1回答

scraperwiki如何限制執行時間？

scraperwiki如何決定停止預定運行？它是基於實際執行時間還是CPU時間？或者也許別的東西。我颳了一個站點，其中Mechanize需要30s來加載每個頁面，但我使用很少的CPU來處理頁面，所以我想知道服務器的緩慢是否是一個主要問題。

0熱度

1回答

ScraperWiki/Python：當屬性爲false時過濾掉記錄

我在ScraperWiki上使用以下代碼來搜索特定哈希標籤的Twitter。它工作得很好，正在挑選推文中提供的任何郵政編碼（如果沒有可用的郵件，則返回虛假）。這是通過data['location'] = scraperwiki.geo.extract_gb_postcode(result['text'])行來實現的。但我只是隻有對包含郵編信息的推文感興趣（這是因爲它們將在稍後階段添加到Goog

6熱度

2回答

Screenscaping ASPX與Python機械化 - JavaScript表單提交

我想湊英國食品評級機構數據ASPX SEACH結果頁面上scraperwiki（http://scraperwiki.com/scrapers/food_standards_agency/）使用機械化/ Python的，但拿出一個（E，G http://ratings.food.gov.uk/QuickSearch.aspx?q=po30）。問題當試圖按照其具有的形式是「下一個」頁面鏈接： <in

0熱度

1回答

有沒有辦法刪除scraperwiki上的視圖？

有沒有辦法刪除scraperwiki上的視圖？我無法在網站的任何位置找到方法。

7熱度

1回答

我可以在本地安裝「scraperwiki」庫嗎？

scraperwiki python模塊是否可用於在Scraperwiki.com Web界面之外進行安裝？它看起來像source可用，但沒有打包。