PDFTextStripper stripper = new PDFText2HTML(encoding);
String result = stripper.getText(document).trim();
結果解析包含有類似 <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"
"http://www.w3.or
我是Apache PDFBox庫的新手。 我要地圖字體信息的PDF段落 我已經通過Questios How to extract font styles of text contents using pdfbox? 走了,但它並沒有提供有關該段落寫有字體信息。 例如,如果我的網頁包含文本: PARA1:宋體 PARA2:Times New Roman字體 那麼我應該能夠得到該PARA1是用宋體,而