我想找到其中包含BeautifulSoup4文本和一些噪音的鏈接:查找其文本的文本有可能包含噪聲
<a href="#">
<span>gggggggggggg</span>
Some text123
<div>fdsfdsfdsfd</div>
<span> fdsfdsfdsfd</span>
</a>
當我試圖通過「有些text123」找到它,它失敗:
soup123.find("a", "Some text123") # => NoneType
這是什麼解決方案?
更新:
的「一」是不是單一的一個,可以有很多。但帶有「一些text123」的「a」是獨一無二的。
用'soup123.find嘗試( 「A」,文本= re.compile (「一些text123」))' – Fejs
請發佈真正的html代碼 –
@Fejs我試過並沒有收到任何東西 –