2012-06-13 55 views
0

如何使用正則表達式來獲取以下內容。標籤內的內容可能是字母,數字&元字符。使用REGEX在pattern.compile上刪除特定的HTML標記

輸入Srting:"<p>Hi </p><p>there</p>"

預期輸出:"Hi<p>there</p>.

+5

什麼是規則?先刪除'

'?刪除第一個標籤?刪除所有標籤,但不是最後一個?刪除包含至少一個空格的標籤嗎?標籤是否可以包含屬性(例如'style =「」')? – sp00m

+1

除非它非常簡單和微不足道,否則不要使用正則表達式來解析HTML。改用HTML解析器。 –

+0

同意Bala,除非尋找一個特定的標籤,不要使用正則表達式 - 這樣做可能是相當艱鉅的。如果您只是想在結束標記之前刪除空白區域,那麼這非常簡單。 – Feuerwehrmann

回答

0

直到futher規格到達,使用以下命令:

<p>(.)*?</p>並使用第一個(也是唯一一個)組*(。)?

這符合<p> Hi </p>然後用\ 1到REFFERENCE '嗨'