在Haskell中解壓縮GZip

haskell

2012-04-09 125 views 5 likes

我很難搞清楚這一點。這是我想要的：在Haskell中解壓縮GZip

ghci> :m +System.FileArchive.GZip -- From the "MissingH" package 
ghci> fmap decompress $ readFile "test.html.gz" 
*** Exception: test.html.gz: hGetContents: invalid argument (invalid byte sequence)

爲什麼我會得到那個異常？

我也試過Codec.Compression.GZip.decompress從zlib package，但我不能得到類型String而不是ByteString。

來源

2012-04-09 Snowball

這不是一個完整的答案，但可能'readFile'試圖解碼'test.html.gz'，就好像它是在你的系統編碼中的文本編碼一樣。改用二進制讀取。 – 2012-04-10 00:55:45

回答

從ByteString到String的轉換取決於壓縮文件的字符編碼，但假設它是ASCII或Latin-1的，這應該工作：

import Codec.Compression.GZip (decompress) 
import qualified Data.ByteString.Lazy as LBS 
import Data.ByteString.Lazy.Char8 (unpack) 

readGZipFile :: FilePath -> IO String 
readGZipFile path = fmap (unpack . decompress) $ LBS.readFile path

如果你需要一些其他編碼類似的工作UTF-8，用適當的解碼功能代替unpack，例如Data.ByteString.Lazy.UTF8.toString。

當然，如果您正在解壓縮的文件不是文本文件，最好將其保存爲ByteString。

來源

2012-04-10 01:15:42 hammar

如果是，解壓縮然後解碼爲文本 – alternative 2012-04-10 01:23:31

相關問題

1. Gzip解壓縮
2. 解壓縮GZIP流
3. ASP.NET MVC WEB API Gzip壓縮 - 解壓縮
4. 如何讓Haskell的Network.Browser做gzip壓縮？
5. 在JavaScript中解壓縮Gzip緩衝區
6. 爲silverlight解壓縮gzip流
7. 解壓縮gzip http請求
8. GZIP串壓縮不解壓「£」字符
9. javascript gzip壓縮
10. AppEngine gzip壓縮
11. gzip壓縮
12. GZip解壓縮停止在任意點
13. 在Hadoop/PIG中壓縮/解壓gzip數據是否透明？
14. gzip和webpack壓縮
15. 透明GZIP壓縮
16. 啓用GZIP壓縮
17. 啓用gzip壓縮
18. Spring MVC gzip壓縮
19. Web Api gzip壓縮
20. Gzip壓縮與MockRestServiceServer
21. Protobuf與GZIP壓縮
22. PHP中的GZIP壓縮
23. 使用Gzip壓縮/解壓縮一個字節數組
24. node.js如何流化22GB gzip壓縮文件解壓縮
25. 的Python zlib的解壓縮gzip壓縮數據
26. 黑莓手機 - GZip解壓縮問題
27. gzip - 破解常見的壓縮級別
28. Java按順序解壓縮GZIP流
29. 異步解壓縮gzip文件
30. 的NSXMLParser initWithContentsOfURL - 解析gzip壓縮響應