在問這個問題之前,我已經查看了多個表單。基本上,我需要的是在HTML文件中選擇部分文本。 html的構造是這樣的在html中選擇文本的一部分使用Java
<div class = "pane big">
<code>
<pre>
SomeText
<a id="par1" href="#par1">¶</a>
MoreText
.
.
.
<a id="par2" href="#par2">¶</a>
MoreText
</pre>
</code>
</div>
所以我需要做的,是通過自身提取href標記PAR1下面的文本,然後分別得到下PAR2 href標記的文字。我試圖使用Jsoup,但我所能做的只是選擇整個文本與div。還嘗試過XPath,但我正在評估的表達式不被接受。不確定也許是因爲它不是以XML文件開頭的。
以及我使用的XPath表達式的示例。
/html/body/div/div[2]/code[2]/pre/text()[3]
和CSS
body > div > div.pane.big > code:nth-child(7) > pre
否我需要MoreText部分,而不是封閉的href標籤之間的文本。謝謝您的回覆 – Dreamer