2017-02-14 43 views
0

我有一個包含多個表格的html文件。我只想提取表中某個地方包含Crtf NoCrtf的表。我能得到的所有表與僅爲HTML表格提取和寫入CSV文件包含特定單詞的美麗湯和Python

soup.find_all('table')

,但我並不需要每個表,只包含前面提到的「CRTF NoCrtf」表。我是蟒蛇和美麗湯的全新品牌,任何人都可以將我指向正確的方向嗎?

+0

你能提供該文件的URL嗎? –

+0

這是一個下載的文件。你有沒有可以發送給我的電子郵件? –

+0

最好把它放在publich分享網站上,這樣多人可以試試 – theodox

回答

1

BeautifulSoup

csv

不知道你的意思包含CRTF nocrtf,但如果你的意思是,則文本:

tables = soup.find_all('table') 
for table in tables: 
    if 'Crtf NoCrtf' in table.get_text(): 
     {{ "code for writing to csv" }} 

如果你指的是類 'CRTF NoCrtf',那麼:

tables = soup.find_all('table', {'class': 'Crtf NoCrtf'}) 
for table in tables: 
    {{ "code for writing to csv" }} 

使用csv library來自python,你可以以任何你想要的格式將數據寫入csv。