如果我使用wget
下載this頁:HTML文件獲取「wget的」報告爲二進制「少」
wget http://www.aqr.com/ResearchDetails.htm -O page.html
,然後嘗試在less
查看頁面,少報告的文件作爲一個二進制文件。
less page.html
"page.html" may be a binary file. See it anyway?
這些響應頭:
Accept-Ranges:bytes
Cache-Control:private
Content-Encoding:gzip
Content-Length:8295
Content-Type:text/html
Cteonnt-Length:44064
Date:Sun, 25 Sep 2011 12:15:53 GMT
ETag:"c0859e4e785ecc1:6cd"
Last-Modified:Fri, 19 Aug 2011 14:00:09 GMT
Server:Microsoft-IIS/6.0
X-Powered-By:ASP.NET
打開該文件在vim工作正常。
任何線索爲什麼不能處理它?
鬱悶在HTML元中它被報告爲「charset = iso-8859-1」 - 大概這只是錯誤的? – Joel
絕對不是ISO-8859-1。也許它來自一個模板或者文件被意外地用UTF-16保存。 – palacsint