我使用Python殼牌這樣:如何在python中顯示非ascii字符?
>>> s = 'Ã'
>>> s
'\xc3'
如何打印s變量來表現人物580這是第一個也是最簡單的問題。真的,我從網頁中獲得的內容不像前一個那樣具有ascii字符,並且像á,é,í,ñ等代字符。另外,我試圖用這些字符執行一個正則表達式針對網頁內容的模式表達。
如何解決這個問題?
這是一個正則表達式的例子:如果我使用Expresson應用程序工作正常
u'<td[^>]*>\s*Definición\s*</td><td class="value"[^>]*>\s*(?P<data>[\w ,-:\.\(\)]+)\s*</td>'
。
編輯[05/26/2009 16:38]: 對不起,關於我的解釋。我會盡力解釋更好。我不得不從一個頁面獲取一些文本。我有該網頁的網址,我有正則表達式來獲取該文本。我認爲的第一件事是正則表達式是錯誤的。我用Expresso檢查過,工作正常,我收到了我想要的文本。所以,我認爲的第二件事是打印頁面的內容,那是當我看到內容不是我在網頁源代碼中看到的內容時。區別在於非ASCII字符,如á,é,í等。現在,我不知道我必須做什麼,如果問題出在頁面內容的編碼或正則表達式的模式文本中。我定義的一個正則表達式是前一個。
問題wolud是:有任何問題使用正則表達式模式文本有非ASCII字符?
爲什麼你需要表現出它在殼? – SilentGhost 2009-05-26 14:08:20
它只是測試 – jaloplo 2009-05-26 14:14:27
對不起大家關於我在Python中的無知。我是新手,對於我寫的文本以及翻譯過程中的表現感到尷尬。另外,我使用的是正則表達式,並認爲非ascii字符不會像現有的那樣被替換,而不是像''這樣的奇怪字符(這是「字符」)。那麼,謝謝你試着理解我的問題並儘可能回答你的問題。 對不起。 – jaloplo 2009-05-27 09:55:17