蟒蛇3解碼串STA Ã ŸË

2017-09-13 74 views 4 likes

我怎麼能解碼包含的東西像這樣的字符串：使用python蟒蛇3解碼串STA Ã ŸË

sta&#195;&#159;e

到

staße

。

（編輯：解讀源作爲HTML實體不會導致預期的結果，但「staÃe」）

背景：我奮力使用與亞馬遜MWS響應串上班mws client你當做pip install mws。特別想知道，因爲sourcestring看起來像包含2個特殊字符，但目標只是'ß'。

In the docs他們在談論一個Unicode字符的限制我不明白

來源

2017-09-13 Telcrome

試過[解碼HTML實體Python字符串？]（https://stackoverflow.com/questions/2087370/decode-html-entities-in-python-string），但不做這項工作。 –

也是我的第一個想法，但是將轉義字符解釋爲html實體（就像在鏈接的線程中）會導致「sta？」。我試過在http://www.convertstring.com/de/EncodeDecode/HtmlDecode – Telcrome

是的，只是看到了。 –

回答

嗯，這裏的問題是，ß是UTF-8的兩個字節序列表示：C3 9F十六進制或195 159（十進制）。但是，當您將實體解碼爲HTML時，它們最終會以Unicode 代碼點 195和159,195作爲代碼點。你將不得不做一些巫術，比如將str改爲bytes，然後將bytes解碼爲（Unicode）str。比較的結果：

print('\xc3\x9f') 

print(bytes('\xc3\x9f', 'Latin-1').decode())

來源

2017-09-13 12:35:57

謝謝，你的代碼片段結合utf-8作爲輸出xml文件的編碼解決了問題 – Telcrome

相關問題

1. 解碼蟒蛇的base64字符串
2. 蟒蛇urllib2解碼問題
3. 蟒蛇URL解碼％E3
4. 蟒蛇minidom命名XML解析器3
5. 蟒蛇3空圖
6. 將字符串轉換 - 蟒蛇3
7. 蟒蛇解析字符串規則
8. 解析字符串作爲JSON蟒蛇
9. 蟒蛇無法解析JSON字符串
10. XML解析蟒蛇
11. 解析YAML蟒蛇
12. 蟒蛇2.7問題與解碼UTF8
13. 如何解決編碼蟒蛇
14. 蟒蛇，編解碼器，file.writelines（）的UnicodeDecodeError
15. 蟒蛇閱讀串
16. 蟒蛇：字符串
17. 蟒蛇重新串
18. 蟒蛇加「E」串
19. GAE蟒蛇ASCII編碼解碼器傾斜解碼字節2
20. 蟒蛇挑戰3級
21. 除以蟒蛇大量3
22. 蟒蛇3從範圍
23. 歸併排序蟒蛇3
24. 問題與蟒蛇3
25. 蟒蛇重複排序3
26. 蟒蛇移動到Python 3
27. 編碼解碼有問題。蟒蛇。 Django的。 BeautifulSoup
28. 蟒蛇3中的Labelnode計時器3
29. 蟒蛇 - XML/HTML解析problam
30. 解析JSON到Excel - 蟒蛇