3
我是BeautifulSoup4
的新手,並且遇到了一個似乎很基本的問題。我只能通過身份證找到,但不能按班上課。例如,我在看它有HTML在它下面的部分站點:只能通過id找到,而不能通過班級找到BeautidulSoup4(Python3.x)
現在,以下工作:
page_soup.findAll('div', {'id': 'page-content'})
而下面發現什麼:
page_soup.findAll('div', {'class': 'main-container'})
所以我的問題是:'class'與'id'屬性有區別嗎?如果是這樣,按類名搜索的正確方法是什麼?
只是爲了完成,雖然我認爲沒關係,但我通過使用selenium
包的page_source方法獲得了html。
編輯:Here是這種頁面的一個例子。如果我們檢查上表,包括玩家的位置,年齡等,我們會得到上面的html快照。
我假設您在發佈此問題時在第二行中發生了錯字? '{'class:'main-container'}' – DMan
@Dan,是的,謝謝你,修正它 – splinter
這兩行應該返回至少一個標記。你能包含更多的代碼和html數據嗎? –