2015-07-21 67 views
-5

我試圖從本網站上抓取目錄信息。 'http://www.virginiaequestrian.com/main.cfm?action=greenpages&sub=view&ID=10478'爲什麼我的解析器不能正常工作

但我不知道如何選擇不同的文本行,因爲他們的唯一標籤是換行符元素(
)。有沒有一種方法可以通過文本而不是標籤進行搜索?

r=requests.get('http://www.virginiaequestrian.com/main.cfm?action=greenpages&sub=view&ID=10478') 
soup=BeautifulSoup(r.content,'lxml') 
tbl=soup.findAll('table')[2] 
print tbl.br 
+3

嘛'打印tbl.br'是專門一個指令,用於打印表格中包含的'
'標籤,所以我不太明白你的期望。 – JJJ

+0

你認爲'print tbl.br'的輸出是什麼? – Krumelur

+0

夥計們,我真的很陌生,請分配責備愚昧而不是愚蠢。我希望我能得到每個單位的文本值。例如地址的第一部分。 – user3590113

回答

0

您正在查找的文本位於表格中的第二個TR中。所以,

print tbl.findAll('tr')[2] 

真的是沒有的文本內部的任何良好的結構,然而,你對你自己有關獲取聯繫人姓名等