24
A
回答
22
邊界推動壓縮機結合瘋狂的結果算法。常見的算法包括:
- 的和here - 洗牌字符(或其他比特塊)與可預測的算法,以增加重複塊這使得源更容易壓縮。正常情況下會發生解壓縮,並且反向轉換會導致結果不重排。注意:單獨使用BWT實際上並不壓縮任何內容。它只是使源更容易壓縮。
- Prediction by Partial Matching (PPM) - arithmetic coding的演變,其中預測模型(上下文)是通過處理有關源與使用靜態概率的統計信息來創建的。儘管它的根源在於算術編碼,但結果可以用霍夫曼編碼或字典以及算術編碼來表示。
- 上下文混合 - 算術編碼使用靜態上下文進行預測,PPM動態選擇單個上下文,上下文混合使用許多上下文並權衡其結果。 PAQ使用上下文混合。 Here's高級概述。
- Dynamic Markov Compression - 與PPM相關,但使用比特級上下文與字節或更長。
- 此外,Hutter獎參賽者可以用外部字典中的小字節條目替換常見文本,並使用特殊符號區分大小寫文本,而不是使用兩個不同的條目。這就是爲什麼他們擅長壓縮文本(特別是ASCII文本),而不是像常規壓縮那樣有價值。
Maximum Compression是一個非常酷的文本和一般壓縮基準站點。 Matt Mahoney發佈另一個benchmark。 Mahoney可能特別感興趣,因爲它列出了每個條目使用的主要算法。
3
0
如果您想將PAQ作爲程序使用,您可以在基於debian的系統上安裝zpaq
軟件包。用法是(也man zpaq
見)
zpaq c archivename.zpaq file1 file2 file3
壓縮爲約1/10日一個zip文件的大小的。 (1.9M VS 15M)
相關問題
- 1. 文本壓縮 - 什麼算法使用
- 2. 壓縮文件中記錄的壓縮算法是什麼?
- 3. 什麼是C++的當前狀態AMP
- 4. Microsoft ProClarity的當前狀態是什麼?
- 5. AspectJ的當前狀態是什麼?
- 6. 什麼是PocoCapsule當前狀態?
- 7. 使用什麼語音壓縮算法?
- 8. 在JavaScript中壓縮純文本?
- 9. 壓縮算法
- 10. 什麼是數據轉儲的最佳壓縮算法
- 11. 增加數字的最佳壓縮算法是什麼?
- 12. 什麼是提取結構/壓縮序列的好算法?
- 13. 保證壓縮比的壓縮算法?
- 14. 什麼是這種壓縮方法?
- 15. 什麼是「壓縮JSON」?
- 16. SignalR客戶端的Java端口的當前狀態是什麼?
- 17. 算法Html壓縮
- 18. Zend中加速器的當前狀態是什麼?
- 19. 斯卡拉工具的當前狀態是什麼?
- 20. 什麼是gmail html模板的當前CSS狀態?
- 21. 什麼是Rust支持iOS的當前狀態?
- 22. PHP社區的當前狀態是什麼?
- 23. Cookie2規範的當前狀態是什麼?
- 24. 64位Windows上GHC的當前狀態是什麼?
- 25. 在python中壓縮文本的代碼是什麼?
- 26. 壓縮當前數據庫
- 27. 什麼是MSI文件使用的壓縮方法?
- 28. 什麼是壓縮文件名的好方法?
- 29. 獲取webkit webview當前選定文本的方法是什麼?
- 30. 縮短純文本文本
我看到一旦一個(模擬)的文章提出文本的有損壓縮,具有優良的性能(大小!)......很有趣。 – PhiLho 2008-10-25 14:18:15
@PhiLho嘿,這基本上就是Summly做:) http://www.theregister.co.uk/2013/03/25/yahoo_buys_summly/ – 2013-05-04 21:38:21