任何人都有一個很好的解決方案,用JavaScript生成的內容(在這種情況下,HTML表格)抓取頁面的HTML源代碼?任何人都有一個很好的解決方案,用JavaScript生成的內容(在這種情況下,HTML表格)抓取頁面的HTML源代碼?
令人尷尬簡單,但可行的解決方案使用Crowbar:
<?php
function get_html($url) // $url must be urlencode(d)
{
$context = stream_context_create(array(
'http' => array('timeout' => 120) // HTTP timeout in seconds
));
$html = substr(file_get_contents('http://127.0.0.1:10000/?url=' . $url . '&delay=3000&view=browser', 0, $context), 730, -32); // substr removes HTML from the Crowbar web service, returning only the $url HTML
return $html;
}
?>
使用撬棍優點是表將被提供(訪問)感謝,基於Mozilla的瀏覽器無頭。編輯:發現Crowbar的問題是一個衝突的應用程序,而不是服務器停機時間,這只是一個巧合。