我試圖從一個文件中提交的文本形式在網站上與機械化但文字並不好看那裏,如果我複製粘貼如下:不能保存編碼文本在Python
████
█⌡⌡⌡⌡████
█⌡⌡⌡⌡⌡⌡⌡⌡⌡█████
█⌡⌡⌡⌡⌡████⌡⌡⌡⌡⌡⌡████
█⌡⌡⌡██ ██⌡⌡⌡⌡⌡⌡⌡⌡█████
█⌡⌡⌡⌡█ █⌡⌡⌡⌡██⌡⌡⌡⌡⌡⌡⌡████
如果我使用的Python代碼如下所示:
����
���������
���������������
��������������������
������ ���������������
������ ������������������
����� ������ ���������������������
������������� �������� ���������������������������
大概是一些關於編碼,不能使它發揮作用。在原始文件textfile.txt中,編碼是OEM-US,我使用了googled並且是cp437。
def functionaa(linksite, text):
import mechanize
import cookielib
# Browser
br = mechanize.Browser()
# Cookie Jar
cj = cookielib.LWPCookieJar()
br.set_cookiejar(cj)
# Browser options
br.set_handle_equiv(True)
br.set_handle_gzip(True)
br.set_handle_redirect(True)
br.set_handle_referer(True)
br.set_handle_robots(False)
br.set_handle_refresh(mechanize._http.HTTPRefreshProcessor(), max_time=1)
edit = br.open(link)
html1 = edit.read()
br.select_form(nr=0)
br.form['textcode'] = "[pre]%s[/pre]" % text
br.submit()
f=open(r'E:\ABC\textfile.txt', 'r')
content = f.read()
functionaa("http://site.com", content)
我有ActivePython 2.5,從我所知道的ASCII,每2.x python是ASCII,只有3.x是unicode。 – Martzy 2013-03-10 16:34:23
抱歉有關誤導性問題。無論如何,您可以在閱讀文本後更改文本的編碼。簡單地解碼並對其進行編碼它('str.decode( 'CP437')。編碼( 'UTF-8')')。這在大多數情況下都會起作用。而且大多數情況下。我的意思是網站。 – StoryTeller 2013-03-10 16:37:15
我剛剛添加了content.decode('cp437')。encode('utf-8'),它在網站上是一樣的:( – Martzy 2013-03-10 16:43:56