2017-05-30 66 views
0

我設置了一個本地mediawiki實例。它運行良好。現在我想在整個維基百科本地。如何將維基百科數據集成到本地mediawiki?

我發現這個轉儲:https://dumps.wikimedia.org/enwiki/latest/

我下載哪個文件?

下載後,如何設置將數據推送到mediawiki?我使用的是:https://github.com/rlewkowicz/docker-mediawiki-stack在我的AWS實例上設置MediaWiki。

我的最終目標是使用AWS實例中的Wikipedia Search API,而不是公共可用的端點。

回答

0

維基百科轉儲很大,您的安裝可能會崩潰。如果你想嘗試,mwdumper可能是你最好的選擇xml文件。這不是很好維護。我不認爲有自動推送更新的現成解決方案。

+0

嗨,該轉儲中有很多xml文件。我下載哪些? –

+0

取決於你想要的。如果您使用基於時間戳的URL(例如https://dumps.wikimedia.org/enwiki/20170520/),您可以獲得有關什麼是什麼的信息。 – Tgr