2016-12-06 232 views
1

我可以彈出一個網頁,沒有任何問題。我可以保存網頁...作爲HTML,沒問題。我需要將網頁保存爲mht,以便我可以獲取所有隱藏的html而不保存爲mht。在研究中我完全沒有提到如何使用python保存爲mht。就像我上面說我可以嘗試將其保存爲一個文件MHT使用編碼保存爲HTML標準但根本不起作用......不要驚訝它也不起作用,但它是值得一試。Python中,保存爲mht

url = 'https://www.thewebsite.com' 
html = urllib.request.urlopen(url).read() 

m = open('websitetest.mht', 'w') 
m.write(str(html)) 
m.close() 

我試圖保存的網站在保存爲mht時會遇到「隱藏代碼」,但不會保存爲html。因此爲什麼我試着讓我得到的所有代碼爲mht保存,然後可以通過代碼來拉斷什麼,我需要編譯的數據庫。

+0

你有沒有做過任何研究嗎?似乎有幾個工具可以做到這一點。 – jonrsharpe

+0

通過查看這裏計算器並鍵入「python的MHT文件」只取得了只是一對夫婦這還遠遠沒有我是想做些什麼結果的。 – confused

+0

@jonrsharpe所以這些是什麼工具? – user1712447

回答