2011-04-12 25 views
0

我的原始資料來源是HTML格式不正確的XHTML。更糟糕的是,我將不得不清理並將html轉換爲xhtml,然後喂飛碟。飛碟接受HTML不是XHTML

回答

2

Flying Saucer不支持HTML;如其website所述:「不支持遺留HTML(雖然有幾個開源的Java HTML清理程序可以提供不同的質量)」。雖然你可以嘗試一下他們建議的HTML清潔工。最好的之一是,毫不奇怪,HtmlCleaner

0

Flying Saucer UserGuide回答了我的問題。

飛碟是一個XML/CSS渲染器, 這意味着它需要XML文件作爲輸入 ,適用的格式和使用CSS樣式 ,併產生XML作爲輸出的渲染 表示。 輸出可能會轉到屏幕(在 GUI中),圖像或PDF文件。 因爲我們相信大多數人會 興趣重新使用他們的網絡佈局的知識 ,我們的 內容主要針對的是XHTML 1.0(嚴格),一個XML文檔 格式的標準化 HTML。然而,我們接受任何 格式良好的XML用於渲染,只要提供了CSS, 就會告訴我們如何佈局它。在XHTML的情況下, 默認樣式表提供了 的包裝盒並且包裝在 庫中,這意味着飛碟可以通過 使 得到體面的結果。