我想製作一個程序,如果系列名稱會將我的文件重命名爲維基百科中的插曲名稱。我雖然也許可以將情節列表獲取到表格或一些數據結構並重命名文件。它可以完成,如果是這樣,我怎樣才能得到維基百科的情節列表? 謝謝使用維基百科表格重新命名文件
-2
A
回答
3
如果您想獲取維基百科文章的文字,可以使用the API。
例如,要獲得文章的HTML(包含在XML),你可以用這樣的請求:
http://en.wikipedia.org/w/api.php?format=xml&action=parse&page=List%20of%20Breaking%20Bad%20episodes
如果你喜歡用wiki文字,而不是HTML工作,查詢將是這樣的:
0
從維基百科檢索數據是很容易的。我會去使用Python與 檢索頁面urllib2
或requests或mechanize。你最喜歡的編程語言可能有類似的功能。用BeautifulSoup分析檢索到的頁面並使用它來檢索名稱。
更難的是將本地文件名映射到該表,除非您的原始文件已經具有類似S1E7的內容,您不知道從您創建的表中選擇哪個片段名稱。
如果我想獲取其他系列的列表,我只需替換我想要的系列的titles參數吧? – 2013-03-24 12:52:36
@ aizen92是的,假設所有文章遵循相同的命名約定(他們應該)。 – svick 2013-03-24 12:58:48