簡單的Web抓取PHP Xpath DOM

2012-11-21 66 views 1 likes

我正在嘗試學習網絡抓取並使用此示例獲取頁面中的鏈接。有沒有更好的方法來做到這一點，或者例如什麼是最簡單的方法來獲得h1？簡單的Web抓取PHP Xpath DOM

$html = file_get_contents('page.html'); 

//parse the html into a DOMDocument 
$dom = new DOMDocument(); 
@$dom->loadHTML($html); 

//grab all the links on the page 
$xpath = new DOMXPath($dom); 
$hrefs = $xpath->evaluate("/html/body//a"); 

for ($i = 0; $i < $hrefs->length; $i++) { 
    $href = $hrefs->item($i); 
    $url = $href->getAttribute('href'); 
    echo "<br />Link: $url"; 

}

來源

2012-11-21 e.e

回答

沒有必要與/html/body到你的前面加上expath，//a應該正常工作。

此外，我會使用foreach而不是for循環，但這主要是一種文體選擇。

來源

2012-11-21 17:18:43 MrGlass

使用PHP的捲曲函數與domdocument而不是file_get_contents來刮取它很容易和強大 –

相關問題

1. Xpath的PHP抓取鏈接
2. 簡單的PHP屏幕抓取功能
3. 在php中使用xpath抓取鏈接
4. Scrapy - 抓取簡單網站的問題
5. PHP簡單的XPath問題
6. 如何在PHP中使用Xpath簡單的HTML DOM分析器
7. PHP DOM/XPath
8. Dom和xpath php
9. PHP的XPath屏幕抓取問題
10. PHP簡單的DOM Dom內存問題
11. PHP簡單的HTML DOM解析器：提取整個DOM樹
12. PHP簡單的HTML DOM單元格值
13. 使用XPATH讀取XML PHP DOM
14. 通過簡單的HTML獲取元素無法讀取的簡單方法Dom Dom解析器在PHP中
15. PHP的XML DOM使用XPath
16. PHP DOM-的XPath上表
17. 用PHP抓取JSON
18. DOM的XPath HTML提取
19. PHP簡單的HTML DOM解析器
20. PHP簡單的HTML DOM解析器
21. PHP簡單的HTML DOM破壞縮進
22. php簡單的html DOM問題
23. PHP簡單的DOM解析器
24. PHP簡單的HTML DOM解析器 - 環
25. PHP簡單的HTML DOM - 遍歷頁面
26. PHP - 簡單的HTML Dom解析器
27. PHP簡單的HTML DOM分析器模
28. PHP簡單的HTML DOM - 標籤ATTRIB
29. php簡單的html dom <tr> bgcolor
30. 簡單的PHP網頁抓取腳本出錯了