我想read_csv
csv文件與西里爾字體與pandas。python熊貓read_cvs加載utf-8
import pandas
data = pandas.read_csv('dataset.csv', delimiter='\|\|', engine='python', encoding='utf-8')
print type(data.name[0])
<type 'str'>
在這裏,我期待得到unicode
與
print type(u'hello')
<type 'unicode'>
我做錯了嗎?
Python是鴨類型。你永遠不應該問什麼類型的對象。這就是說,你需要提供一些例子,你可以展示你的產品和你想要的產品。你的代碼顯示正確AFAIK – firelynx
我不知道熊貓如何實現'read_csv'方法,但是如果它使用std.lib。 'csv'模塊,那麼解決這個問題的方法可能不是微不足道的,因爲Python 2的'csv'不支持解碼文件(實際上這很令人傷心)。現在再切換到Python 3的另一個原因! – lenz