我可以彈出一個網頁,沒有任何問題。我可以保存網頁...作爲HTML,沒問題。我需要將網頁保存爲mht,以便我可以獲取所有隱藏的html而不保存爲mht。在研究中我完全沒有提到如何使用python保存爲mht。就像我上面說我可以嘗試將其保存爲一個文件MHT使用編碼保存爲HTML標準但根本不起作用......不要驚訝它也不起作用,但它是值得一試。Python中,保存爲mht
url = 'https://www.thewebsite.com'
html = urllib.request.urlopen(url).read()
m = open('websitetest.mht', 'w')
m.write(str(html))
m.close()
我試圖保存的網站在保存爲mht時會遇到「隱藏代碼」,但不會保存爲html。因此爲什麼我試着讓我得到的所有代碼爲mht保存,然後可以通過代碼來拉斷什麼,我需要編譯的數據庫。
你有沒有做過任何研究嗎?似乎有幾個工具可以做到這一點。 – jonrsharpe
通過查看這裏計算器並鍵入「python的MHT文件」只取得了只是一對夫婦這還遠遠沒有我是想做些什麼結果的。 – confused
@jonrsharpe所以這些是什麼工具? – user1712447