2011-11-05 77 views
1

我需要你的幫助。我解析維基百科文章並使用維基媒體API。我想閱讀{{ }}之間的文字。這是我的wikimedia api query。我試過但沒有找到任何運氣。誰能幫幫我嗎 ?非常感謝。解析維基媒體api

def getCategory(title): 
paramsd = {'action': 'query', 'prop': 'revisions', 'rvprop': 'content', 'format': 'xmlfm', 'rvsection': 0,'titles':title} 
params = urllib.urlencode(paramsd) 
req = urllib2.Request(url='http://en.wikipedia.org/w/api.php', data=params) 
f = urllib2.urlopen(req) 
+1

*「您正在查看XML格式的HTML表示。 HTML很適合調試,但可能不適合您的應用程序。「* - 應該給你一個提示。 – poke

回答

0

您的代碼有錯誤。

'format': 'xmlfm' 

應改爲

'format': 'xml' 

這樣的話,你會得到XML。