2017-06-14 47 views
0

我使用this program,所有的鳴叫我得到是這樣的「因爲它是在阿拉伯語語言」:Twitter的搜索程序

"text": "\\u0637\\u0627\\u0644\\u0628\\u0629 \\u062c\\u0633\\u0645\\u0647\\u0627 \\u062c\\u0628\\u0627\\u0631 \\u062a\\u062a\\u062e\\u062f \\u0645\\u0646 \\u0627\\u0644\\u0634\\u0627\\u0631\\u0639 \\u0648 \\u062a\\u062a\\u0646\\u0627\\u0643..\\n\\n\\u0633\\u0643\\u0633_\\u0627\\u062c\\u0646\\u0628\\u064a\\n\\u0645 

我有一個問題,它和得到的答案here

問題是:我在哪裏可以在程序中使用ensure_ascii=False,以便它可以正確讀取阿拉伯語的推文?我不知道我需要在哪個地方複製它。

回答

0

您需要修改twitter_search.py

更換所有

json.dump(<something>,fd) 

對於

json.dump(<something>,fd,ensure_ascii=False) 

您還需要全部更換爲<file_descriptor> UTF-8的人

import codecs 
... 
... 
fd = codecs.open("/tmp/lol", "w", "utf-8") 

如果你使用python處理結果,另一種方法是使用ascii字符串。

s='\\u0637\\u0627\\u0644\\u0628\\u0629...' 
print s.encode("utf-8").decode('unicode_escape') 
+0

我你說的做了什麼,但沒有結果,IDK爲什麼 – Mahran

+0

的結果是:在12-16位置「字符映射」編解碼器不能編碼字符:字符映射爲 Mahran

+0

查看更新_____ – xvan