0
我在尋找某種工具,可以採取一個HTML文檔和泵出該文件的選擇基於表示。轉換一個HTML文檔來選擇基於索引文件
例如:
<div>
Some text
<ul class="foo">
<li>First</li>
<li>Second</li>
<ul>
</div>
和輸出的精神,以一個純文本文件:
div
div #text Some text
div ul.foo li Frist
div ul.foo li Second
這樣做的目的是使某種那將是一個謂詞函數能夠比較兩個HTML頁面,並告訴它們匹配什麼程度,並明確能夠孤立地講多少內容或佈局是不同的。
(對於好奇,這是一個比較大的數據遷移項目的QA階段)
如果你正在尋找一個工具來做到這一點,而不是自己寫的工具,那麼也許這個問題是不是編程有關。 – ChrisW 2009-09-18 22:43:23
感謝您的評論克里斯。 我這樣做,不過,相信不寫代碼是一樣多的編程爲編寫代碼。 – memet 2009-09-18 23:51:23
這就是我認爲這是一個簡短/簡單的編碼問題,我想編寫它,而不是尋找一個現有的工具:1)將HTML加載到DOM 2)步行/遍歷節點DOM 3)打印在你指定的格式的每個節點(包括其祖先informatin)。 – ChrisW 2009-09-20 11:58:28