2015-09-06 50 views
2
<div class="number" title="Player number">1211</div> 
<div class="shirt" title="sName">Ronaldo 1211</div> 

我颳了一個網站。我已經設法打印出來了。這裏是我的代碼:Python打印沒有標籤與美麗的擦除數據

web = urllib2.urlopen("WEBSITE") 
soupit = BeautifulSoup(web, 'html.parser') 
scrapeme = soupit.findAll("div", { "class" : "number" }) 
print scrapeme 

打印出:

<div class="id" title="Player number">1211</div> 

我希望它打印只是1211我該怎麼辦呢?

回答

2

任何beautifulsoup對象的get_ text()方法正是如此。

print(scrapeme.get_text()) 
0

一旦你有你的元素列表,scrapeme,您可以通過每個元素在列表循環和打印的使用文本屬性:

for element in scrapeme: 
    print(element.text) 

因爲在你的榜樣刮只生成一個列表包含一個scrapeme元件,在這種情況下,輸出將只是:

1211 
+0

謝謝!有沒有解釋.text函數完全實現的功能? –

+0

嘗試在這裏搜索「文本」http://www.crummy.com/software/BeautifulSoup/bs4/doc/ – gtlambert