2016-10-03 69 views
-1

我試圖找到包含pageIds和標題的維基百科轉儲。我不想在運行時請求它或請求2000每個請求,我希望它所有,我想做一個屬於他們的所有pageIds和標題的長列表,並將它們放入我自己的數據庫,以便我可以使用它在一個從我自己的數據庫請求數據的應用程序中。維基百科轉儲所有頁面標題和頁面標識

有人知道哪些轉儲包含這些信息嗎?不要緊,如果他們還包含更多的信息,我需要什麼 - 我可以寫一個應用程序,選擇我需要的信息。

我確實試圖請求它......這將需要140天,他們提出了2700個請求的限制...所以它需要永久獲得整個事情,而不是我想下載一個文件啞巴和清理數據和文件上傳到只包含信息我自己的數據庫,我需要

回答

-1

好吧發現自己越來越多轉儲後,在很短的答案是: enwiki - 最新-page.sql.gz

它包含pageids和Titles。

條目是這樣的: (1217768,0, 'Black_River_(South_Carolina)', '',0,0,0,0.6285160577990001, '20161001141146', '20161001142916',738899573,1654, 'wiki文字')

第一個數字是pageId。第三項是標題。

休息我不知道是什麼 - 但不管:D感謝我自己我解決了這個問題,並將其關閉:D大包拍拍

相關問題