我使用HtmlCleaner庫來解析/轉換java中的HTML文件。HTMLCLEANER處理西班牙文字符
似乎是無法處理的西班牙字符,如「ÁáÉéÍíÑñÓóÚúÜü」
有沒有我可以在HtmlCleaner處理這個或任何其他解決方案設置的任何財產?下面是我使用調用它的代碼:
CleanerProperties props = new CleanerProperties();
props.setRecognizeUnicodeChars(true);
java.io.File file = new java.io.File("C:\\example.html");
TagNode tagNode = new HtmlCleaner(props).clean(file);
有沒有辦法將編碼設置爲使用UTF-8? – Makoto 2012-04-24 14:29:10
我在寫入文件時使用的是UTF-8。 '新PrettyHtmlSerializer(道具).writeToFile(tagNode,filePath,「utf-8」);' – choop 2012-04-24 14:35:32
但是HTML文件實際編碼爲UTF-8? – 2012-04-24 18:19:30