我想使用<br>
標記在我的html
中拆分文本。如果文本長度超過50個字符,我想用<br>
替換10個字符前的空格。如何更改re.sub中的原始匹配
的文本是<span class="value">TEXT</span>
例如<span class="value">cccc cc cccccc cccc cc c</span>
意志變成了:<span class="value">cccc cc<br>cccccc<br>cccc cc c</span>
所以每行最多可以有10個字符。
我已經爲此創建了一個正則表達式,它可能會找到這樣的標籤,但無法弄清楚如何從匹配的組中提取文本,然後將其替換。
snippet = re.sub(r'<span class="value">(.*)<\/span>',
r'<span class="value">\1<\/span>'.(divide text using <br> tags)
你知道該怎麼做嗎?
Nooo ... do ** not **使用正則表達式解析,處理和生成XML/HTML。使用XPath,XSLT,BeautifulSoup,... –