我做了一個屏幕抓取模塊,它工作得很好,但有一定的侷限性。現在我想刪除這些邊界,但我得到如此不可預知和不同的錯誤。在你腦子裏有什麼事情之前,讓我wat實際上是在發作。最初我使用屏幕抓取來檢索一組關鍵字(搜索內容)的搜索結果,谷歌的所有搜索引擎如co.in/co.uk/nl/de/com。在PHP問題屏幕抓取
但是現在我不得不在一個循環中搜刮多個搜索引擎和多個關鍵字的邏輯。
讓我們看看這個用一個例子:
keyword se company rank
telephony google.co.in airtel 01
telephony google.co.in bsnl 04
telephony google.co.in aircel 06
telephony google.co.in idea 03
mobile op google.co.uk airtel 09
mobile op google.co.uk bsnl 04
等.. 超過6個關鍵字和所有顯示的搜索引擎,併爲所有的公司。
最初我是爲一個關鍵字,se和所有company.reporting它現在我必須列出所有關鍵字,se,公司。簡單地我用循環做that.But我面臨這些錯誤:
- 存儲器分配343322111個字節溢出(... [移除此我使用的ini_set(「存儲器」)FUNC]
- 總和請求後谷歌使用capcha。 刪除capcha我使用sleep或usleep()但它不能解決purpose.atlast錯誤:連接重置 我無法在usleep中使用30sec或更長func.it需要幾小時才能恢復info.My代碼搜索數據爲5頁的谷歌,這意味着50 responses.Lib使用
simple_html_dom.php
它工作正常1頁頁面但不超過3頁。我該怎麼做/使用?
您是否嘗試將時間限制設置爲0? 「參數或者set_time_limit(0);」。對於文檔:http://php.net/manual/en/function.set-time-limit.php(默認是30秒,我猜) – frail 2011-04-01 12:09:16
是的,它被使用。因爲只有我能夠執行一個頁面。因爲可能會出現帶寬有限的情況。 – 2011-04-01 12:11:26