2
美麗的湯塗抹出HTML,以便每個元素開始一個新行。中等縮小HTML(來自美麗湯的輸出)
我發現所有的HTML縮小器都壓縮一切到一行。
是否有,在某處(最好是在Python中)一個將輸出正常HTML的工具。那就是:塊元素會得到一個新行,但內聯元素不會?
BS輸出
<h2>
headline
</h2>
<p>
Blah blah
<b>
bold text
</b>
same paragraph blah
<a href="">
a link in the text
</a>
</p>
<p>
Another paragraph
</p>
精縮
<h2>headline</h2><p> Blah blah <b> bold text </b> same paragraph blah <a href=""> a link in the text </a></p><p> Another paragraph</p>
我想要什麼
<h2>headline</h2>
<p> Blah blah <b> bold text </b> same paragraph blah <a href=""> a link in the text </a></p>
<p> Another paragraph</p>
所以我結合htmlmin(https://pypi.python.org/pypi/htmlmin/),而不是BS4的STR()解決方案。 (因爲字符編碼和其他一些事情,我需要BS4的正常輸出。)Works。 –
邪惡的領主在你身後https://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags –