我試圖提取網頁上特定「輸入」標記中的單個「值」屬性的內容。我使用下面的代碼:使用beautifulsoup提取屬性值
import urllib
f = urllib.urlopen("http://58.68.130.147")
s = f.read()
f.close()
from BeautifulSoup import BeautifulStoneSoup
soup = BeautifulStoneSoup(s)
inputTag = soup.findAll(attrs={"name" : "stainfo"})
output = inputTag['value']
print str(output)
我得到一個類型錯誤:列表索引必須是整數,而不是str的
即使從Beautifulsoup文檔我的理解是字符串不應該是一個問題在這裏...但ia沒有專家,我可能會誤解。
任何建議,非常感謝! 在此先感謝。
偉大的東西!謝謝。現在我有一個關於解析輸出的問題,我輸入了很長的一串非ASCII字符,但是我會在單獨的問題中提出這個問題。 – Barnabe 2010-04-10 07:33:30
不應按照http://stackoverflow.com/questions/2616659/extracting-value-in-beautifulsoup訪問'值'。在這種情況下,上述代碼的作用是什麼?我以爲你必須通過'output = inputTag [0]來訪問這個值。內容' – Seth 2010-04-11 23:31:01
@Seth - 不,因爲他正在查找輸入標籤的attrib'value',而.contents返回標籤封裝的文本(我是.contents) - (現在只是回覆,因爲我必須加倍檢查發生了什麼;圖其他人可能會受益) – 2011-07-27 00:33:01