2012-04-16 78 views
0

我有兩個HTML頁面,其中頁面的內容是列1和列2。列1在兩頁中具有相同的數據,而列2不同(將列2視爲計數器值)。如何比較這兩個頁面比較防火牆後面的兩個HTML頁面

選項,我有:

1)使用的工具,我用(了SoapUI而定)寫劇本,並分析每個HTML頁面 2)使用一些內置的可用於Java庫/ Perl/Python

我正在尋找像quickdiff.com這樣的方式。

注意:html頁面被防火牆擋住,無法通過互聯網上的公共含義差異工具訪問。這兩個html頁面是來自同一網站的實例。

任何關於如何解決這個問題的指針?

感謝

編輯:正如我所提到的,html頁面包含兩列,其中第一列是在兩個頁面和列2同樣是一個計數器的值。如果COLUMN1是有值「a」和COLUMN2是1,那麼column1也是「a」,column2是第2頁中的2,這些將被diff命令認爲是不同的。我想把它們看成是一樣的。換句話說忽略列2只看到在列1

+0

u能請加入更多的描述,不知道如果我跟着?可能會作爲答案? – SuperMan 2012-04-16 02:52:04

回答

0

差異,您可以使用wgetdiff以示區別:

diff <(wget -q -O - http://www.site1.com/) <(wget -q -O - http://www.site2.com/) 
+0

問題是網頁是服務器名稱的形式,wget仍然可以用於這樣的一些URI ?我想我會嘗試你的建議 – SuperMan 2012-04-16 02:58:38

+0

是的,它[支持](http://www.gnu.org/software/wget/manual/wget.html#URL-Format)任何[有效的URL](http:// www .ietf.org/RFC/rfc1738.txt)。 – 2012-04-16 03:02:23

+0

Beau - 正如我所提到的,html頁面包含兩列,其中列1在兩個頁面中相同,而列2是計數器。如果列1的值爲「a」,列1在第1頁中爲1,那麼列1也是「a」第2頁中的第2列是2,這些將被diff命令認爲是不同的。我想把它們看成是一樣的。換句話說,忽略column2,只能看到column1中的差異,這是否有意義? – SuperMan 2012-04-16 04:59:56

相關問題