2011-10-11 41 views
-1

可能重複:
Best methods to parse HTML with PHP檢索只有一個HTML文件的一部分使用的file_get_contents

我用在PHP中file_get_contents()函數來獲取遠程網頁並運行它變成我的表解析腳本。但基本上,我的表解析腳本只需要頁面上的第一個表。

我想下載的頁面有3個html表格,所以我想知道是否有一種方法只採取第三個表格?很可能我只想在HTML文件中使用30到60行。有沒有人有什麼建議?

回答

0

沒有文件下載命令會爲您解析HTML文件,並確定需要下載的確切塊。我不認爲有辦法下載整個東西,然後用HTML parser來獲取表格。

0

你可以將你的主文件分成三個單獨的文件(每個表格只有一個文件),它們只是被包含在原文件中。

然後你只需要爲你想要的表格做一個file_get_contents

編輯

舉個例子,考慮這個文件:

<h1>I am a header</h1> 
<table id = 'table1> 
... 
</table> 

<table id = 'table2'> 
... 
</table> 

<table id = 'table3'> 
... 
</table> 

並將其與該文件進行比較:

<h1>I am a header</h1> 
<?php 
    include 'table1.php'; 
    include 'table2.php'; 
    include 'table3.php'; 
?> 

table1.php將只需持有該表標籤之間的一切表1,並且類似地對於table2.phptable3.php

如果你想表3,執行您file_get_contentstable3.php

+0

我不想第2個表雖然 – Shane

+0

如果他們在不同的文件中,你可以得到你想要哪一個。 –

+0

我如何將它們分成不同的文件? – Shane

相關問題