2015-01-31 82 views
1

我想使用捲曲從網站上獲取內容。我得到的錯誤是。使用捲曲「檢查瀏覽器前訪問...」錯誤使用捲曲

我試圖改變在捲曲不同的屬性,但仍沒有運氣

「訪問roosterteeth.com之前檢查你的瀏覽器」。我曾嘗試使用PHP簡單的HTML Dom解析器,但再次沒有運氣。

下面是我當前的代碼。

<?php 
$divContents = array(); 
$userAgent = 'Mozilla/5.0 (Windows NT 5.1; rv:31.0) Gecko/20100101 Firefox/31.0'; 
$html = curl_init("http://roosterteeth.com/home.php"); 
curl_setopt($html, CURLOPT_RETURNTRANSFER, true); 
curl_setopt($html, CURLOPT_BINARYTRANSFER, true); 
curl_setopt($html, CURLOPT_USERAGENT, $userAgent); 
curl_setopt($html, CURLOPT_SSL_VERIFYPEER, false); 
$content = curl_exec($html); 
foreach($content->find("div.streamIndividual") as $div) { 
$divContents[] = $div->outertext; } 
file_put_contents("cache.htm", implode(PHP_EOL, $divContents)); 
$hash = file_get_contents("pg_1_hash.htm"); 
$cache = file_get_contents("cache.htm"); 
if ($hash == ($pageHash = md5($test))) { 
} else { 
$fpa = fopen("pg_1.htm", "w"); 
fwrite($fpa, $cache); 
fclose($fpa); 
$fpb = fopen("pg_1_hash.htm", "w"); 
fwrite($fpb, $pageHash); 
fclose($fpb); 
} 
?> 

因爲它的立場上面的代碼顯示了不同的錯誤,由於找到命令不能夠獲得任何內容。下面的代碼顯示我從網站獲得的錯誤。

<?php 
$divContents = array(); 
$userAgent = 'Mozilla/5.0 (Windows NT 5.1; rv:31.0) Gecko/20100101 Firefox/31.0'; 
$html = curl_init("http://roosterteeth.com/home.php"); 
curl_setopt($html, CURLOPT_RETURNTRANSFER, true); 
curl_setopt($html, CURLOPT_BINARYTRANSFER, true); 
curl_setopt($html, CURLOPT_USERAGENT, $userAgent); 
curl_setopt($html, CURLOPT_SSL_VERIFYPEER, false); 
$content = curl_exec($html); 
echo $content; 
?> 

我對這個錯誤的預感是服務器認爲我是一個機器人(我不會責怪它相信這個)。我用curl看看我是否可以假裝成一個客戶,繞過檢查器,但沒有成功。我希望有人能夠闡明這一點。

對於視覺誤差點擊這個link.

感謝您的時間:)

+0

該網站檢查cookie,如果它不存在,設置cookie和重定向瀏覽器....你需要激活cookies以進行CURL傳輸。但它看起來Cookie將由JavaScript設置... – Eugen 2015-01-31 22:21:34

回答

-1

如果你想訪問的網站使用WordPress的,它是definetly存在安全隱患。它是一種已知的WP惡意修改,並將用戶重定向到一些不同的網站。所以在這種情況下,問題不在你的代碼中。