2017-10-11 60 views
0

我學的課程學習Python,我嘗試着做一些刮,但是我有我的計劃有些困難刮(我用PyCharm):與BeautifulSoup [求助]

import urllib2 

from BeautifulSoup import BeautifulSoup 

url = urllib2.urlopen(raw_input("Enter - ")) 

soup = BeautifulSoup(url, "html.parser") 

tags = soup("span") 

total = [] 

for tag in tags: 

    total.append(int(tag)) 

print sum(total) 
print len(total) 

問題是,當我運行代碼,我想要報廢的頁面打開,但代碼不運行,即我沒有我的列表的總和和長度

+0

什麼是你想刮的頁面? – mentalita

+0

'tag'是一個'Tag'對象,你不能把它變成int。你應該使用'int(tag.text)'或其他一些屬性。 –

+0

我認爲'湯(「span」)'是錯誤的,因此我懷疑標籤可能是空的。你應該確保路徑是正確的,以便以後處理任何東西。 – lerner

回答

0

你是什麼意思的「數字」的數字?檢查出來,如果這是你的意思:

import requests 
from lxml import html 

response = requests.get("http://py4e-data.dr-chuck.net/comments_35201.html").text 
tree = html.fromstring(response) 
title = [item.text for item in tree.cssselect(".comments")] 
for x in range(len(title)): 
    print("{} {}".format(x+1,title[x])) 

部分結果:

1 97 
2 91 
3 88 
4 87 
5 87 
6 86