我不能得到關於Python如何在文件處理Unicode一握...Python中的Unicode文件中
f = open('test.txt', 'w')
f.write('abc')
f.close()
這給了3個字節的文件。
f = open('test.txt', 'w')
f.write('abcé')
f.close()
這給了5個字節的文件(é佔據兩個字節,但Python是怎樣知道它必須有讀2個字節?)
f = open('test.txt', 'w')
f.write('abcそ') # a Japanese character
f.close()
這給出了6個字節的文件(そ需要三個字節,但Python如何知道它必須讀取3個字節?)
所以我可以理解,Unicode需要兩個字節,但它有時是1或2或3字節,我看不見怎麼運行的。
http://en.wikipedia.org/wiki/Variable-length_code ,http://en.wikipedia.org/wiki/UTF-8 – 2012-07-12 19:56:04
我不知道爲什麼這很重要,但這不是一箇中國字。 – quantum 2012-07-12 19:56:12
oops ...你說得對,它是日文,改變了評論... – Paul 2012-07-12 19:59:37