我使用Beautifulsoup分析一個網站蟒蛇beautifulsoup加入
request = urllib2.Request(url)
response = urllib2.urlopen(request)
soup = BeautifulSoup.BeautifulSoup(response)
我使用它遍歷表額外的結束標記。我遇到的問題是BS爲表格添加了一個額外的結束標記到不存在的html中,我使用print soup.prettify()進行了驗證。所以,其中一個td標籤已經離開表格,我無法選擇它。
你可以發佈不工作的HTML代碼的基本結構嗎? – 2010-08-17 17:14:18
也會喜歡這個答案。在我的情況下,似乎BS是在頁面的源代碼中添加* not *的標籤 – 2012-04-08 23:12:59