好日子親愛的社區!如何使用PHP解析一個非常簡單的表格
我需要構建一個函數來解析一個非常簡單的表 (帶有一些標籤和值)的內容,請參閱下面的URL。我已經使用各種方式來解析html源代碼。但這一個是有點棘手!見我需要解析的目標 - 它有一些invaild標記:
目標:http://www.schulministerium.nrw.de/BP/SchuleSuchen?action=644.0013008534253&SchulAdresseMapDO=194190
嗯,我這一個
<?php
require_once('config.php'); // call config.php for db connection
$filename = "url.txt"; // Include the txt file which have urls
$each_line = file($filename);
foreach($each_line as $line_num => $line)
{
$line = trim($line);
$content = file_get_contents($line);
//echo ($content)."<br>";
$pattern = '/<td>(.*?)<\/td>/si';
preg_match_all($pattern,$content,$matches);
foreach ($matches[1] as $match) {
$match = strip_tags($match);
$match = trim($match);
//var_dump($match);
$sql = mysqli_query("insert into tablename(contents) values ('$match')");
//echo $match;
}
}
?>
好試了一下 - 見正則表達式在線7-11:它不匹配!我不得不重做這個腳本的解析器部分。我需要解析一些不同的東西 - 因爲parsercode不完全符合目標。它旨在取回表格的結果。
任何人都可以幫助我在這裏得到一個更好的正則表達式 - 或更好的方式來解析這個網站... 任何和所有的幫助將大大apprecaited。
問候 零
做TD的有屬性或其他sruff?怎麼樣一個XML解析器? – 2010-12-19 11:08:26
''無法在您要解析的網頁中顯示。 – 2010-12-19 11:08:36
看看http://simplehtmldom.sourceforge.net/(爲了您的html解析需要) – Andreas 2010-12-19 11:10:42