0
我有一個包含多個表格的html文件。我只想提取表中某個地方包含Crtf NoCrtf
的表。我能得到的所有表與僅爲HTML表格提取和寫入CSV文件包含特定單詞的美麗湯和Python
soup.find_all('table')
,但我並不需要每個表,只包含前面提到的「CRTF NoCrtf」表。我是蟒蛇和美麗湯的全新品牌,任何人都可以將我指向正確的方向嗎?
我有一個包含多個表格的html文件。我只想提取表中某個地方包含Crtf NoCrtf
的表。我能得到的所有表與僅爲HTML表格提取和寫入CSV文件包含特定單詞的美麗湯和Python
soup.find_all('table')
,但我並不需要每個表,只包含前面提到的「CRTF NoCrtf」表。我是蟒蛇和美麗湯的全新品牌,任何人都可以將我指向正確的方向嗎?
不知道你的意思包含CRTF nocrtf,但如果你的意思是,則文本:
tables = soup.find_all('table')
for table in tables:
if 'Crtf NoCrtf' in table.get_text():
{{ "code for writing to csv" }}
如果你指的是類 'CRTF NoCrtf',那麼:
tables = soup.find_all('table', {'class': 'Crtf NoCrtf'})
for table in tables:
{{ "code for writing to csv" }}
使用csv library來自python,你可以以任何你想要的格式將數據寫入csv。
你能提供該文件的URL嗎? –
這是一個下載的文件。你有沒有可以發送給我的電子郵件? –
最好把它放在publich分享網站上,這樣多人可以試試 – theodox