所以我使用了BeautifulSoup。這讓我有些HTML節點的文本,但這些節點具有一定的Unicode字符轉換爲:逃脫序列串中將Python轉義的Unicode序列轉換爲UTF-8
例如,有這樣的一個HTML元素: 50 €
由BeautifulSoup檢索,如: soup.find("h2").text
作爲此字符串:50\u20ac
,它只能在Python控制檯中讀取。 但是,當寫入JSON文件時,它變得不可讀。 注意:我將以下代碼保存到json: with open('file.json', 'w') as fp: json.dump(fileToSave, fp)
如何將這些Unicode字符轉換回UTF-8或其他什麼使它們再次可讀?
你嘗試: F =開放( 'somefile', 'WB'),然後 f.write( '你的文字') –
**你保存爲JSON **是什麼意思?你是否將JSON返回給其他函數,或者你是否將它寫入文件? – chad
@chad寫入JSON文件。 –