2012-04-05 63 views
-1

我正試圖解決pythonchallenge.com中的Python挑戰。我在二級。我被要求在網頁源代碼中給出的非常大的文本中找到罕見的字符。這裏是: http://www.pythonchallenge.com/pc/def/ocr.htmlPython挑戰級別2

首先,我不想爲此提供任何解決方案。我只是想自己解決它,但我不是一個高級的Python程序員。那麼你能告訴我要學什麼來解決這個問題嗎?我也不知道如何處理文件。在論壇上的一些線索中,提到應該使用文件來解決這個問題。那麼你能告訴我要學什麼嗎?

+0

在此網站上搜索。例如:輸入'python read file' – 2012-04-05 13:26:42

回答

1

提示1:要打開和讀取文件的內容,使用

with open("filename") as f: 
    contents = f.read() 

提示2:要計算字符數,一個選擇是使用一個Counter

2

首先,將所有字符讀入一個字符串。您可以使用urllib2下載文件open以從本地磁盤讀取該文件,或者對其內容進行硬編碼。包括這樣一長串你的Python程序,你可能需要使用triple-quotes字符串,如:

""" 
%%[email protected]_$^__#)^)&!_+]!*@&^}@[@%]()%+$&[([email protected]%+%$*^@$^!+]!&_#)_*}{}}!}_]$[%}@[{[email protected]#_^{* 
@##&{#&{&)*%(]{{([*}@[@&]+!!*{)!}{%+{))])[!^})+)$]#{*+^((@^@}$[**$&^{[email protected]#$%)[email protected](& 
... 
""" 

要找出每個字符的出現次數的多少,看看collections.Counter

2

使用Counter從集合 來計算每個字符的出現次數以找到「罕見」字符。

在您查看計數結果後,我會讓剩下的讓您弄清楚。