有人可以指導我如何使用BeautifulSoup拉標籤的價值?我閱讀了文檔,但很難瀏覽它。例如,如果我有:使用BeautifulSoup拉標籤值
<span title="Funstuff" class="thisClass">Fun Text</span>
我該如何拉「Funstuff」busing BeautifulSoup/Python?
編輯:我使用的3.2.1版本
有人可以指導我如何使用BeautifulSoup拉標籤的價值?我閱讀了文檔,但很難瀏覽它。例如,如果我有:使用BeautifulSoup拉標籤值
<span title="Funstuff" class="thisClass">Fun Text</span>
我該如何拉「Funstuff」busing BeautifulSoup/Python?
編輯:我使用的3.2.1版本
你需要有東西來識別你正在尋找的元素,這是很難分辨它是什麼,在這個問題上。
例如,這兩個都會在BeautifulSoup 3中打印出Funstuff。一個查找span元素並獲得標題,另一個查找給定類的跨度。許多其他有效的方法可以達到這一點。
import BeautifulSoup
soup = BeautifulSoup.BeautifulSoup('<html><body><span title="Funstuff" class="thisClass">Fun Text</span></body></html>')
print soup.html.body.span['title']
print soup.find('span', {"class": "thisClass"})['title']
問:我對BeautifulSoup import語句是: 從BeautifulSoup進口BeautifulSoup,CData的 然而,上面的代碼似乎只有在工作的時候: 進口BeautifulSoup 任何想法,爲什麼? – user1463925 2012-07-23 19:29:39
這只是Python。如果你正在進行相對導入('從BeautifulSoup導入BeautifulSoup'),則將該行從'soup = BeautifulSoup.BeautifulSoup(...'更改爲'soup = BeautifulSoup(...' 請參見http:// docs。有關更多信息,請參閱python.org/tutorial/modules.html。 – 2012-07-23 20:10:20
一個標籤孩子們通過.contents http://www.crummy.com/software/BeautifulSoup/bs4/doc/#contents-and-children 你的情況,你可以找到的標籤是使用它的CSS類的內容提取
from bs4 import BeautifulSoup
soup=BeautifulSoup('<span title="Funstuff" class="thisClass">Fun Text</span>')
soup.select('.thisClass')[0].contents[0]
http://www.crummy.com/software/BeautifulSoup/bs4/doc/#css-selectors有可用的所有細節nevessary
這是BeautifulSoup 3還是BeautifulSoup 4? – 2012-07-23 18:40:22
其3.2.1 ..10char – user1463925 2012-07-23 18:41:43