首先讓我告訴你我來自哪裏。我有一個字符串,這是一個網站的HTML代碼,我用JSOUP得到了這個。反正這樣的HTML都在字符串中,我可以打印到一個文本文件。所以我想從這個代碼裏獲得歌曲和每首歌曲是由同一個「標籤」如何使用模式獲取2個已知字符串之間的值
這是從文本文件我打印它
<div class="title" itemprop="name">
Wrath
</div> </td>
在記事本中,它看起來像一條線一行,但是當你複製和粘貼它看起來像這樣。所以,我想是在中間的憤怒,所以我試圖使一個模式使用此其他疊後其幫助找到:Java regex to extract text between tags
這是我的代碼的部分,具有與此
Pattern p = Pattern.compile("<div class=\"title\" itemprop=\"name\">(.+?)</div> </td>");
Matcher m = p.matcher(html);
while(m.find()) {
quote.add(m.group(1));
}
做
當它運行時,它顯示ArrayList引用中沒有任何內容。這可能不起作用,因爲它計算了兩者之間的空間。有任何想法嗎?
嘗試使用[XPath的來代替。(http://docs.oracle.com/javase/7/docs/api/javax/xml/ xpath/package-summary.html) – jreut