2011-01-28 74 views
5

我需要html解析,它能夠識別生成的html中的錯誤,並且如果標記未關閉,請關閉它並返回有效的html。HTML解析器驗證標記

更多詳細信息:我從數據庫獲取數據並打破該記錄以顯示我的網站上的部分詳細信息,以便點擊更多按鈕,然後顯示完整內容。打破字符串然後驗證。

我已經使用Html敏捷包,但我是新來使用它,如果這個庫解決了我的問題,然後指導我如何(教程)或建議我另一個庫。

回答

1

這裏有一對夫婦從萬維網聯盟的驗證程序,在W3C的:

的Windows:http://validator.w3.org/docs/install_win.html

UNIX/Linux的:http://validator.w3.org/docs/install.html

您還可以使用自己的Web服務來驗證您的CSS,HTML,XML,XHTML,JavaScript和許多其他網絡技術。 W3C是保持互聯網高度互操作性和互聯網設備相互兼容的監管機構之一。

+0

讀的問題再次,我已經添加了更多的細節,以便更好地理解 – Xulfee 2011-01-28 12:44:49

1

我不認爲這樣的圖書館確實存在。問題是,有些庫確實可以識別HTML中的錯誤,但他們無法爲你修復它們。

我認爲使用W3C validator作爲服務是最好的出發點。有一個開源庫,它使用W3C驗證程序的API來驗證文檔,如果它有效或不符合錯誤和警告,則會向您提供響應。我會從這開始,然後從那裏繼續。