0
我有這段代碼從網站上刮取數據。需要幫助的PHP php
<?php
$html = file_get_contents('http://www.alanum.com/search.aspx?kw=GTX%20980'); //get the html returned from the following url
$pk_doc = new DOMDocument();
libxml_use_internal_errors(TRUE); //disable libxml errors
if(!empty($html)){ //if any html is actually returned
$pokemon_doc->loadHTML($html);
libxml_clear_errors(); //remove errors for yucky html
$pk_xpath = new DOMXPath($pk_doc);
//get all the h2's with an id
$pk_row = $pk_xpath->query('//h4[@name="list-productname"]');
$pk_row2 = $pk_xpath->query('//div[@class="price"]');
if($pk_row->length > 0){
foreach($pk_row as $row){
echo $row->nodeValue . "<br/>";
}
}
if($pk_row2->length > 0){
foreach($pk_row2 as $row2){
echo $row2->nodeValue . "<br/>";
}
}
}
?>
我是新來的網頁抓取所以我怎麼跳過例如,如果
'//div[@class]'
這讓所有有類的div標籤,但我想跳過一些的div的我不要。我怎麼做?
還有一個問題是如何合併$pk_row
和$pk_row2
因爲$pk_row
有名字和$pk_row2
具有價格。
我想要一個單一的數組裏面有這些值。 name=>
和price=>
「// DIV [@類=「名稱 - 放大「]'如果這個div必須被跳過,那麼它會是'// div [@class!=」name-expanded「]'? –
'// div [not(@ class =「name-expanded」)]' – icaine