2009-09-18 74 views
0

我在尋找某種工具,可以採取一個HTML文檔和泵出該文件的選擇基於表示。轉換一個HTML文檔來選擇基於索引文件

例如:

<div> 
Some text 
    <ul class="foo"> 
    <li>First</li> 
    <li>Second</li> 
    <ul> 
</div> 

和輸出的精神,以一個純文本文件:

div 
div #text Some text 
div ul.foo li Frist 
div ul.foo li Second 

這樣做的目的是使某種那將是一個謂詞函數能夠比較兩個HTML頁面,並告訴它們匹配什麼程度,並明確能夠孤立地講多少內容或佈局是不同的。

(對於好奇,這是一個比較大的數據遷移項目的QA階段)

+0

如果你正在尋找一個工具來做到這一點,而不是自己寫的工具,那麼也許這個問題是不是編程有關。 – ChrisW 2009-09-18 22:43:23

+0

感謝您的評論克里斯。 我這樣做,不過,相信不寫代碼是一樣多的編程爲編寫代碼。 – memet 2009-09-18 23:51:23

+0

這就是我認爲這是一個簡短/簡單的編碼問題,我想編寫它,而不是尋找一個現有的工具:1)將HTML加載到DOM 2)步行/遍歷節點DOM 3)打印在你指定的格式的每個節點(包括其祖先informatin)。 – ChrisW 2009-09-20 11:58:28

回答