2012-02-14 72 views

回答

10

將這些字符標準化爲一種類型可以更好地啓用GZIP壓縮,爲什麼它碰巧是雙引號是巧合。

的GZip工作的標準方式壓縮可能,所以例如,如果你有一個字符串,如:

"Foo", 'bar', "baz"

你可以壓縮",作爲一個單一的性格特徵(允許使用#符號來表示) ,減少了串的東西,如:

"Foo#'bar', "baz"

在另一方面,如果你有:

"Foo", "bar", "baz"

你可以壓縮", "b它如:

"Foo#ar#az"

因此通過消除可用字符的總數導致較短的字符串。

再次,使其成爲一個既報價不要緊,就像只要它是一致的。

這裏有一個剪切+粘貼從我的Linux命令行演示了:

[email protected]:~$ cat 1.txt 
"Foo", 'bar', "baz" 

[email protected]:~$ cat 2.txt 
"Foo", "bar", "baz" 

[email protected]:~$ cat 1.txt.gz 
&▒:O1.txtSr▒▒W▒QPOJ,R▒QPJJ▒R▒(▒P▒ 

[email protected]:~$ cat 2.txt.gz 
<▒:O2.txtSr▒▒W▒QPJJ,▒PUJ\tE▒ 

[email protected]:~$ ls -la *txt* 
-rw-rw-r-- 1 briang briang 20 2012-02-14 16:39 1.txt 
-rw-rw-r-- 1 briang briang 46 2012-02-14 16:37 1.txt.gz 
-rw-rw-r-- 1 briang briang 20 2012-02-14 16:39 2.txt 
-rw-rw-r-- 1 briang briang 41 2012-02-14 16:38 2.txt.gz 

你可以看到gziping這樣的小文件,增加了尺寸,而不是降低,而是看兩個原始輸入之間的gzip的區別獲得了這個概念。標準化的gzip文件小5個字節。

+0

爲什麼downvote?這不正確嗎?或者它是一個復仇投票? ;)無論哪種方式與我很好,但我只想我的答案:P – PeeHaa 2012-02-14 20:22:58

+0

雖然我不是downvoter,我覺得它......可疑......只是標準化的報價類型會幫助gzip。 – Charles 2012-02-14 20:23:54

+1

@Charles我會在一會兒添加內容。在我解釋他錯了之後,這個低調的選民實際上是一個刪除了他們的答案的人。他繼續通過我的個人資料進行低調投票。 – Incognito 2012-02-14 21:01:20