2011-02-25 54 views
0

我不想使用simple_html_dom,如何使用PHP正得到URL部分1.html2.html3.html和文字部分111222333?謝謝。如何使用php來正則文本部分和url部分?

<p>items</p> 
<div> 
<ul> 
<li><a href="1.html">111</a></li> 
<li><a href="2.html">222</a></li> 
<li><a href="3.html">333</a></li> 
</ul> 
</div> 
+2

你爲什麼不想使用dom解析器?這將是該工作的正確工具。 – 2011-02-25 10:44:49

+0

你的意思是正則表達式? – hsz 2011-02-25 10:45:40

+2

它甚至在快速啓動下列在simple_html_dom網站的索引頁面上。你甚至試圖自己解決這個問題嗎? – 2011-02-25 10:47:43

回答

6

通過PHP定期,我假設你的意思是PERL正則表達式。

preg_match_all('/<li><a href="([^"]+)">(.+?)<\/a><\/li>/', $html, $matches); 

然後$matches[1]將有鏈接的文檔列表,並$matches[2]將有文字。

+0

即PERL正則表達式的名稱。謝謝。 – cj333 2011-02-25 10:53:51

+1

比賽應該使用'。+?'來避免吃得太多。更好的是''^「] +'和'[^ <] +'爲特異性 – mario 2011-02-25 10:53:56

+0

@mario你是對的,我會編輯它 – Savetheinternet 2011-02-25 10:57:25

相關問題