-1
我正在編寫一個爬網程序,它將繞過特定的一組網站並將所有的mp3鏈接抓取到數據庫中。我不想下載文件,只需抓取鏈接,索引它們並能夠搜索它們。使用PHP和如何某些網站臨客guruji.com用於動態鏈接的Mp3鏈接爬行器
我正在編寫一個爬網程序,它將繞過特定的一組網站並將所有的mp3鏈接抓取到數據庫中。我不想下載文件,只需抓取鏈接,索引它們並能夠搜索它們。使用PHP和如何某些網站臨客guruji.com用於動態鏈接的Mp3鏈接爬行器
你可能想研究的正則表達式 - 那麼,你已經接通後,做這樣的事情:
function crawl($url) {
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_TIMEOUT, 30); // 30 second timeout
curl_setopt($ch, CURLOPT_RETURNTRANSFER,1);
$result = curl_exec ($ch);
curl_close ($ch);
if ($result) {
// top domain links
preg_match_all('/<a(?:[^>]*)href=\"([^\"]*)\"(?:[^>]*)>(?:[^<]*)<\/a>/is', $result, $output, PREG_SET_ORDER);
foreach($output as $item) {
// each link found is output
echo "<pre>";
var_dump($item[0]);
// do your magic here
}
}
}
這隻能找到所有鏈接的,所以你必須根據你的使用情況調整比賽,或者拿出一個過濾器。
對你有好處......那麼你的問題是什麼?你想讓我們寫履帶:D? – codaddict 2010-03-18 06:59:34
我需要知道如何做的動態鏈接..我已經寫靜態MP3鏈接的爬行... – ramesh 2010-03-18 07:00:20
這個問題似乎是脫離主題,因爲它是一個毫無疑問的意向聲明。 – Quentin 2013-07-18 16:39:22