2013-03-24 105 views
-2

我想製作一個程序,如果系列名稱會將我的文件重命名爲維基百科中的插曲名稱。我雖然也許可以將情節列表獲取到表格或一些數據結構並重命名文件。它可以完成,如果是這樣,我怎樣才能得到維基百科的情節列表? 謝謝使用維基百科表格重新命名文件

回答

3

如果您想獲取維基百科文章的文字,可以使用the API

例如,要獲得文章的HTML(包含在XML),你可以用這樣的請求:

http://en.wikipedia.org/w/api.php?format=xml&action=parse&page=List%20of%20Breaking%20Bad%20episodes

如果你喜歡用wiki文字,而不是HTML工作,查詢將是這樣的:

http://en.wikipedia.org/w/api.php?format=xml&action=query&titles=List%20of%20Breaking%20Bad%20episodes&prop=revisions&rvprop=content

+0

如果我想獲取其他系列的列表,我只需替換我想要的系列的titles參數吧? – 2013-03-24 12:52:36

+1

@ aizen92是的,假設所有文章遵循相同的命名約定(他們應該)。 – svick 2013-03-24 12:58:48

0

從維基百科檢索數據是很容易的。我會去使用Python與 檢索頁面urllib2requestsmechanize。你最喜歡的編程語言可能有類似的功能。用BeautifulSoup分析檢索到的頁面並使用它來檢索名稱。

更難的是將本地文件名映射到該表,除非您的原始文件已經具有類似S1E7的內容,您不知道從您創建的表中選擇哪個片段名稱。

+0

很好,每個賽季都會有一個文件夾,而且大多我會使用它的動畫系列,所以不會是季節和這樣的,反正我會檢查它 – 2013-03-24 12:11:56

+0

現在,讓整個頁直接不是一個好主意,使用API​​要好得多。 – svick 2013-03-24 12:43:43

+0

@svick,酷,不知道。現在我想知道當我在2002年寫下我的下載時是否存在該API,或者即使那樣我也錯過了API文檔。 – Anthon 2013-03-24 12:48:24