2012-02-19 134 views
0

我在PHP中放置了一個快速提取函數。基本上,它會讀取給定URL的內容並提取必要的HTML代碼。然後它會將代碼放入新頁面。現在,除了一件事我已經做好了一切工作。PHP:從兩個特定標籤之間的字符串中提取文本

我有一個URL的內容的字符串,現在我想提取兩個標籤之間的文本。 假設我想開始以某個標籤複製內容。這很容易,因爲這些標籤有類。

因此,我會用「」開頭的函數,它只是搜索文檔中所有匹配的文本。不過,我遇到了一個問題。在我希望複製的部分中,還有其他標籤。因此,如果我告訴函數在「,」停止提取,那麼刮板將在隨機標記結束時停止讀取。有人可以幫我寫一點PHP代碼,它可以確保函數停止的標記是「」的結束標記,而不是發生在字符串中的一些隨機標記?

在此先感謝。

+4

使用HTML解析器。 – Blender 2012-02-19 20:10:33

+2

[爲什麼人們喜歡克蘇魯這麼多?](http://stackoverflow.com/a/1732454/871050) – 2012-02-19 20:11:37

+0

約10萬億其他S.O問題的重複。 – 2012-02-19 20:13:39

回答

3

沒有辦法做到這一點,並考慮到標籤之間的每一個可能的內容。使用XmlDocument並解析HTML。

相關問題