2015-03-02 66 views
0

我使用html2text用於將HTML轉換成文本, 但它也改變了我的文本字符串以及如A&PA&P;Python的問題

我怎麼才能避免這種變化

In [1]: import html2text 

In [2]: conv = html2text.HTML2Text() 

In [3]: conv.handle("string A&P string") 
P 
&P; 
Out[3]: u'string A&P; string\n\n' 

輸出html2text文本應是

Out[3]: u'string A&P string\n\n' 
+0

正是html2text包您使用的是哪一種?似乎有這個名字的多個工具。 – yole 2015-03-02 08:12:51

回答

0

這是因爲您轉換的字符串有語法錯誤。應該用html語言轉義&。

嘗試

out = conv.handle("string A&P string")