我有一個網站,我需要解析它。解析網址,循環file_get_html(網址),然後獲取元素
首先,我必須解析頁面中的所有目錄的URL,然後我需要輸入所有的URL,然後遍歷所有的URL並再次解析每個頁面上的URL,然後遍歷所有的URL並獲取元素('.description DIV')。
我使用簡單的html dom。
但我有一個問題,當我想要瀏覽所有我第一次解析的網址時。 我得到空頁
include 'simple_html_dom.php';
$catalogs = file_get_html('http://optnow.ru/catalog');
$catalogLink = [];
if(!empty($catalogs)) {
foreach($catalogs->find('div.cat-name a') as $catalog) {
$catalogUrl = 'http://optnow.ru/' . $catalog->href . '?page=0';
$catalogLink[] = $catalogUrl;
$catalogHtml = file_get_html($catalogUrl);
$productsLink = $catalogHtml->find('.link-pv-name');
print_r($productsLink->href);
}
}
我的錯誤在哪裏?
感謝。
'$ catalogLink [0] $ catalogSingleLink' – mehulmpt