我試圖在兩個不同的中國購物網站的「產品頁面」中提取主圖像。PHP的Simple-HTML-DOM適用於一個URL,但不適用於其他
網站2產品頁鏈接: http://detail.china.alibaba.com/offer/1235158006.html
我的代碼工作蠻好的網站#1,但站點#2我得到一個奇怪的短html字符串。
這裏是我的代碼:
<?php
require_once('./includes/simple_html_dom/simple_html_dom.php');
$url="http://www.aliexpress.com/item/100FT-7-Core-Strand-550-Parachute-Cord-Nylon-Lanyard-Desert-Paracord-Survival-Kits-For-Climbing-Camping/541809415.html";
$html=file_get_html($url);
echo "html lenght : ".strlen($html)."<br>";
foreach($html->find('meta[property=og:image]') as $element) {
echo("result : ".$element->content);
}
echo "<br>-------------------------------------------------------------------<br>";
$url="http://detail.china.alibaba.com/offer/1235158006.html";
$html=file_get_html($url);
echo "html lenght : ".strlen($html)."<br>";
foreach($html->find('div[id=J_DetailInside]') as $element) {
echo("result : ".$element->innertext);
}
?>
我一直想任何事情來得到它正確,但沒有成功而工作, 任何幫助將非常感謝!
有可能是第二個網站上的格式錯誤的HTML – 2013-05-08 07:24:15
謝謝你,你們都幫助過我。 – spelltox 2013-05-08 10:23:42