2012-07-23 84 views
6

有人可以指導我如何使用BeautifulSoup拉標籤的價值?我閱讀了文檔,但很難瀏覽它。例如,如果我有:使用BeautifulSoup拉標籤值

<span title="Funstuff" class="thisClass">Fun Text</span> 

我該如何拉「Funstuff」busing BeautifulSoup/Python?

編輯:我使用的3.2.1版本

+0

這是BeautifulSoup 3還是BeautifulSoup 4? – 2012-07-23 18:40:22

+0

其3.2.1 ..10char – user1463925 2012-07-23 18:41:43

回答

6

你需要有東西來識別你正在尋找的元素,這是很難分辨它是什麼,在這個問題上。

例如,這兩個都會在BeautifulSoup 3中打印出Funstuff。一個查找span元素並獲得標題,另一個查找給定類的跨度。許多其他有效的方法可以達到這一點。

import BeautifulSoup 
soup = BeautifulSoup.BeautifulSoup('<html><body><span title="Funstuff" class="thisClass">Fun Text</span></body></html>') 
print soup.html.body.span['title'] 
print soup.find('span', {"class": "thisClass"})['title'] 
+0

問:我對BeautifulSoup import語句是: 從BeautifulSoup進口BeautifulSoup,CData的 然而,上面的代碼似乎只有在工作的時候: 進口BeautifulSoup 任何想法,爲什麼? – user1463925 2012-07-23 19:29:39

+0

這只是Python。如果你正在進行相對導入('從BeautifulSoup導入BeautifulSoup'),則將該行從'soup = BeautifulSoup.BeautifulSoup(...'更改爲'soup = BeautifulSoup(...' 請參見http:// docs。有關更多信息,請參閱python.org/tutorial/modules.html。 – 2012-07-23 20:10:20