任何人都可以提出任何好的基於cURL的PHP瀏覽器/蜘蛛/履帶/ http /文件下載庫..?PHP瀏覽器庫(可能捲曲)
我只是想有從網址下載內容,比如我會implode('', file(url))
或file_get_contents()
做一個工具,但它應該支持超時,HTTP代碼響應,自定義頁眉等
捲曲是真棒,我已經在我創建的函數中使用了它一段時間,但我想要一個封裝的第三方庫。當然,一定有這樣的..我做了一個搜索,但我找不到我想要的。
任何人都可以提出任何好的基於cURL的PHP瀏覽器/蜘蛛/履帶/ http /文件下載庫..?PHP瀏覽器庫(可能捲曲)
我只是想有從網址下載內容,比如我會implode('', file(url))
或file_get_contents()
做一個工具,但它應該支持超時,HTTP代碼響應,自定義頁眉等
捲曲是真棒,我已經在我創建的函數中使用了它一段時間,但我想要一個封裝的第三方庫。當然,一定有這樣的..我做了一個搜索,但我找不到我想要的。
我寫我自己相當不錯的功能使用捲曲:http://pastebin.com/4CPaCfMm
它的工作原理,但我只是雖然我可以搜索一個更先進的面向對象的工具,我可以在我的項目中使用,這將得到保持和furthur發達- 圖書館。
你可以試試這個http://simplehtmldom.sourceforge.net/ 是一個PHP庫parsig /下載內容。
不,它只是一個DOM解析器,不是下載器。 – 2012-02-10 22:58:22
你沒有明白我的觀點,simplehtmldom解析了用'$ html = file_get_html('http://www.google.com/')獲取的返回內容;'< - 這是我需要的,一個高級的「提取器」。 – 2012-02-10 22:59:31
您可以使用此解析器下載圖像 – elo 2012-02-10 23:00:37
我爲我的網絡爬蟲項目使用PHPCrawl。它純粹是獨立的庫,不依賴cURL。
它提供的功能遞歸地下載給定的URL的內容,並支持模式匹配和超時。然後,您可以使用檢索到的URL內容執行任何操作。哦,是的,它可以給你HTTP響應狀態。但不知道自定義標題。
你在那個「瀏覽器庫」中尋找什麼函數 – motto 2012-02-10 22:52:08
只有一個能夠通過頭文件並設置超時的fetchURL()就足夠了。 – 2012-02-10 22:53:49