我正在使用包含一些元素的JSOUP解析HTML。 然而,當我打印結果doc.html(),而不是:從JSOUP解析的HTML中刪除轉義的文本
<script language="JavaScript"> <a href="http://www.company.com/index.htm" </a> </script>
我越來越:
<script language="JavaScript"> <a href="http://www.company.com/index.htm" </a> </script>
在代碼中,我做了操作如下所示:
for (final Element src : doc.select("script")) {
data = data.replace(someText,newText);
src.text(data); <==== I could find this method escapes the text }
我正在使用UTF-8字符集。
如何直接獲取未轉義的文本? 在此先感謝!
您是否擁有對HTML源代碼的控制權? – 2012-04-24 12:48:29