2010-07-14 69 views
2

我必須檢查兩個html頁面之間的區別:一個是舊版本,另一個是更新頁面。需要比較使用Java和硒的2個html文件

我需要Selenium來獲取兩頁的來源,然後比較它們以檢查差異。

我該如何使用Java & Selenium來實現?

下面是我有流量:

  • 轉到使用Selenium
  • 收集舊網頁
  • 所有數據的數據轉換爲標準格式(可能是XML)的舊頁;創建一個類 做到這一點
  • 將數據保存到一個文件
  • 轉到使用Selenium
  • 收集有關新網頁
  • 所有數據的數據轉換爲標準格式的新頁面(XML大概);使用類 創建要做到這一點
  • 將數據保存到一個文件
  • 使用Java庫差異比較兩個文件

誰能給在如何實現這種思想/例子嗎?

+0

你能夠實現這個嗎?如果可能,分享解決方案。 – 2013-09-24 16:29:23

回答

2

爲每個頁面使用selenium.getHtmlSource(),並比較Java中返回的字符串或將它們保存到文件並使用命令行工具(如「diff」)。

如果使用Java,我能想到的兩種方法是使用像StringUtils.difference()(幾乎肯定是一團糟)或更好的方法Google Diff。 Google diff有一個Java庫和測試示例。

當然,這些的輸出將是一個字面差異,你可能想要更多的定製的東西來理解HTML的變化。