2010-07-08 50 views
2

基本上我想編寫php代碼,列出來自外部url的<h1>標籤之間的所有內容。PHP腳本讀取外部HTML源代碼並列出標籤之間的代碼

我不想只是第一個,但他們都是。因此,如果外部網站的來源是

<html> 
    <title></title> 
    <head></head> 
    <h1>Test Here</h1> 
    <h1>Test here</h1> 
</html> 

我想打只產生了<h1>標籤之間的內容,這將是一個腳本:

Test Here 
Test here 

我熟悉PHP,但我只是不能想到這樣做的腳本。

回答

4

simple_html_dom是你的朋友。

$dom = file_get_html("http://yourserver.com/path/to/file.html"); 
// alternatively use str_get_html($html) if you have the html string already... 

foreach ($dom->find("h1") as $node) 
{ 
    echo $node->innertext; 
} 

這是非常強大的,可以做很多,更多。

+0

是的,我也會推薦使用simple_html_dom,因爲寫正則表達式更復雜 – streetparade 2010-07-08 22:50:13

+0

哈哈..那麼你的例子當然看起來更簡單... – 2010-07-08 22:57:52

+0

+1對於html解析器不是正則表達式 – Pete 2010-07-08 23:11:59