0
我正在抓取特定網站的特定鏈接,我將其保存到我的$ url_results數組中。但要排除添加鏈接到陣列如果李集羣,與班上列表items__item,包括兒童安全>兒童安全>子跨度帶班列表items__item__notice的。如何使用Simple HTML DOM和cURL根據具有特定類的子項排除刮取結果?
集羣我刮:
<li>
<a href="" data-lpurl=""> <!--The href I am scraping-->
<span class="list-items__item__position"></span>
<div class="list-items__item__title">
<span class="list-items__item__notice"> <!--I don't want to add to my array if this span is present-->
</span>
</div>
</a>
</li>
我的PHP刮功能:
$items = $html->find('li[class=list-items__item]');
foreach($items as $post) {
$url_results[] = $url . ($post->children(0)->href);
}
我使用Simple HTML DOM和捲曲刮。
該類屬性並不完全正確。 – pguardiario
這是被刮掉的數據,所以我很遺憾沒有任何控制他們使用的類。 – user2304993
不,我的意思是它不符合html中的類 – pguardiario