2017-06-04 92 views
1

我正在嘗試編寫包含許多列表的csv文件。在一些列表中,有unicode包含阿拉伯語。例如:用列表中的阿拉伯文unicode編寫CSV文件

list1 = ['No data'], list2 = ['data1', 'data2, '\\u...', '\\u...'] 

該unicode還包含一個額外的反斜槓。我將如何創建一個csv,或者更改我的代碼,將unicode轉換爲阿拉伯字符?

回答

0

您可以編碼/通過使用下面的函數解碼字符:

your_string.encode("utf-8").decode('unicode-escape') 

例如:

test = "test \\u0643\\uFEBD" 
print(test.encode("utf-8").decode('unicode-escape')) => test كﺽ 

編輯1: 所有的陣列可以轉換要麼循環所有的元素,並將其轉換爲1或1使用地圖功能如:

def f(string): 
    return string.encode("utf-8").decode('unicode-escape') 

for sublist in main_list: 
    sublist = list(map(f, sublist)) 
+0

我的問題處理更多的迭代此列表的Unicode數據。我有一個主列表,其中包含存儲unicode數據的較小列表。我如何能夠將這些嵌套在列表中的信息進行編碼/解碼? – fcb434

+0

我編輯了答案。 –

+0

我仍然收到我與我的原始代碼,這是'列表'對象沒有屬性'編碼'的錯誤 – fcb434