2016-01-29 93 views
0

一系列類似的不包含的模塊順序,我需要分析大量文件,具有設置爲後跟一個DIV一系列標題的元素,像這樣:我如何通過simple_html_dom

<h2> Section Title </h2> 
<div> Section Content</div> 
<h2> Section Title 2</h2> 
<div> Section Content2</div> 
<h4> Section Title 3</h4> 
<div> Section Content 3</div> 

所以基本上在dom中,我需要將<h>與下面的<div>組合在一起。 dom似乎不是兒童/兄弟姐妹/父母功能的元素,而且我還需要考慮輸入文件中的不一致性,所以不希望執行類似查找所有h元素的操作,找到所有divs,並遍歷循環中的每個列表,假設元素是正確的匹配。有沒有什麼方法讓dom建立起來,這樣我就可以使用子功能或者其他一些乾淨的方式來穿過dom來做到這一點?

回答

0

我覺得最簡單的方法就是訪問元素'root',以元素的形式到達dom的頂部。

從那裏可以知道如何遍歷子元素的序列,但在這種情況下,如果內容是可預測的,那麼對div和prev_sibling()的搜索似乎可行,但我的內容可能是