我想抓住的名字和從advisor.travel網站上哪些內容的地方座標爲CC,所以我只需要前10個頁面的名稱和座標...使用XPath抓取文本內容
鏈接到景點鏈接格式:http://en.advisor.travel/poi/1
所以'http://en.advisor.travel/poi/'.i
其中i
是吸引數
我想只有前10的吸引力,所以我是beetween 1個10和XPath的名字是
//h1 tag
和XPath的座標是:
//span[@class='latitude']
//span[@class='longitude']
我現在創建一個刮刀和代碼是:
<?php
for ($i=0; $i<=10; $i++)
{
$dom2 = new DOMDocument();
@$dom2->loadHTMLFile('http://en.advisor.travel' . $i);
$xpath2 = new DOMXPath($dom2);
$data = array();
$data[name] = $xpath2->query("//h1");
$data[latitude] = $xpath2->query("//span[@class='latitude']");
$data[longitude] = $xpath2->query("//span[@class='longitude']");
}
echo '<pre>' . print_r($data, true) . '</pre>';
?>
但這種代碼的結果讓我只有這個:
Array
(
[name] => DOMNodeList Object
(
[length] => 0
)
[latitude] => DOMNodeList Object
(
[length] => 0
)
[longitude] => DOMNodeList Object
(
[length] => 0
)
)
那麼,如何解決這個問題?這裏有什麼問題?
再次是一樣的... –