2010-09-29 96 views
2

我正在使用POI來創建電子表格報告,我有html內容與<p>,<b/>, &nbsp;等,我如何解析這些html標籤在POI? POI中有沒有可以解析html內容的函數?解析POI中的HTML內容

這是我的POI代碼示例:

HSSFCell cell = getHSSFCell(mysheet, 5, 1); 
cell.setCellValue(new HSSFRichTextString(htmlContent)); 

預先感謝您。

回答

1

POI不適用於HTML,適用於MS Office。你想使用的是你的HTML解析部分的Xpath。 XPath是它自己的兔子洞,所以我不會去到它的細節很多,但這裏有一些資源,對Java的XPath:

roseindia tutorial

javadocs

IBM Xpath API

0

其中一個簡單的解決方案是使用HTML解析器解析HTML內容,然後使用POI設置文本。我使用了Jericho HTML Parser。 http://jericho.htmlparser.net/docs/index.html

一個簡單的HTML解析使用傑里科:

Source source = new Source("The HTML Text"); 
String parsedHTMLText = source.getTextExtractor().toString();