我正在使用POI來創建電子表格報告,我有html內容與<p>
,<b/>
,
等,我如何解析這些html標籤在POI? POI中有沒有可以解析html內容的函數?解析POI中的HTML內容
這是我的POI代碼示例:
HSSFCell cell = getHSSFCell(mysheet, 5, 1);
cell.setCellValue(new HSSFRichTextString(htmlContent));
預先感謝您。
我正在使用POI來創建電子表格報告,我有html內容與<p>
,<b/>
,
等,我如何解析這些html標籤在POI? POI中有沒有可以解析html內容的函數?解析POI中的HTML內容
這是我的POI代碼示例:
HSSFCell cell = getHSSFCell(mysheet, 5, 1);
cell.setCellValue(new HSSFRichTextString(htmlContent));
預先感謝您。
POI不適用於HTML,適用於MS Office。你想使用的是你的HTML解析部分的Xpath。 XPath是它自己的兔子洞,所以我不會去到它的細節很多,但這裏有一些資源,對Java的XPath:
其中一個簡單的解決方案是使用HTML解析器解析HTML內容,然後使用POI設置文本。我使用了Jericho HTML Parser。 http://jericho.htmlparser.net/docs/index.html
一個簡單的HTML解析使用傑里科:
Source source = new Source("The HTML Text");
String parsedHTMLText = source.getTextExtractor().toString();