2011-02-27 78 views
0

雖然大部分時間我只是使用file_get_contents和CURL,但我無法讓它在URL中使用端口。我怎樣才能讀取這個文件? http://174.120.124.178:7800/7.html(這是一個shoutcast統計文件)從URL中讀取HTML文件

最終,我只是想在最後一個逗號後面的文本。

+0

請出示一些代碼 – 2011-02-27 23:09:55

回答

4

它與港口無關。他們阻止你,因爲你沒有使用瀏覽器用戶代理。 curl確實讓您僞造用戶代理,但這可能違反了網站的服務條款。

根據this post這不是關於阻止腳本,而是區分Shoutcast客戶端和其他一切。因此,代碼爲:

curl_setopt($curl_handle, CURLOPT_USERAGENT, "Mozilla"); 
+0

雖然這確實解決了我的代碼問題,但最終的問題是我的共享主機帳戶不允許我在80或443以外的端口上使用CURL。 – Jimmy 2011-02-28 23:27:13

0

我試圖用命令行下載Curl文件並得到404錯誤;它確實加載了Firefox和Lynx。 This page表示您需要更改要下載的User-Agent字符串。

+1

閱讀各種論壇的帖子,你只需要一個'用戶Agent'頭包含Mozilla的' 「它裏面的某個地方;請參閱http://forums.shoutcast.com/showthread.php?t=147753。 – 2011-02-27 23:16:37

0

CURLOPT_PORT需要設置到相應的端口也許〜