整個HTML給定一個HTML輸入取計算的文本樣式,而無需渲染在python
html='''This is <b>Bold</b> or <strong>Also Bold</strong> or even <font style="text-weight: bold">Style Bold</font>'''
我想僅過濾出大膽話
注意,這個例子是簡化,我的真實使用情況下,我有幾百萬的文件要處理,有更多的結構和我不關心更多的HTML標籤。
result=["Bold","Also Bold","Style Bold"]
的主要問題是,有幾種方法來設置字體粗細(HTML標籤/樣式表)
而且我不知道是否有一個Python包,可以使只有我在乎的標籤關於並觀察結果,或者唯一的辦法是編寫一個解析器我自己。