我真的有很多離線html文件,我需要從他們的姓名,地址等獲得並創建CSV。HTML離線文件獲取內容
我第一次嘗試做巫婆批次 - 例如:
for /r %%i in (*) DO (
findstr /o "name" %%i >> results.txt
ECHO ; >> results.txt
findstr /o "STREET" %%i >> results.txt
ECHO ; >> results.txt
etc
ECHO xxxendlinexxx >> results.txt
)
它的工作原理,但給我的長文件有什麼需要用正規表示努力工作......我想一定有更好的辦法如何閱讀HTML中的TAG內容。
我發現Python的HTML解析器:
from html.parser import HTMLParser
但我不知道熱,以用於脫機文件和特定的標籤(ID = 「東西」)。我使用Google,在YouTube上觀看內容,但我找不到容易理解的解決方案。
你能幫忙嗎?最好的例子:
- 如何打開文件
- 如何查找特定標籤內容
- 內容保存到另一個文件
謝謝你的幫助。
如果你不提供一個範例HTML文件所需的數據和你希望你的csv看起來像什麼的例子,你如何期望我們創建一個合理的解決方案? – Compo