我正在使用以下正則表達式(在java中)從IMDB中某個actor的電影中獲取id,tittle和year。爲什麼這個正則表達式不符合這個?
/title/tt(\\d+)/\"\\s+itemprop=\"performerIn\"\\s*>\\s*(([\\(|\\)|&#\\d+;|\\w|!|/|:|-|.|,| ]+) \\(\\d\\d\\d\\d\\))</a>
(正則表達式中最重要的部分是什麼是「performerIn」後) 我遇到了麻煩與this頁面拿到冠軍「星戰前傳III - 西斯的復仇(2005) 」。它不匹配。發生什麼事?
你可以將它縮減爲最小的正則表達式和最小輸入字符串,它們共同證明了這個問題? – TimK
請向我們展示您嘗試匹配的示例字符串。順便說一句,從來沒有用正則表達式解析HTML。 – Bergi
顯示你如何使用正則表達式。 ('Pattern.compile'或其他)。 –