2012-03-16 80 views
1

我正試圖抓取特定數據的維基旅行。像氣候,getin等 我已經設法從他們的特殊出口的XML。試圖抓取wikitravel

http://wikitravel.org/en/Special:Export/San_Francisco 我以XML格式的數據,但它是在維基標記,我嘗試瀏覽的解決方案,使該文本,但無法找到一個合適的解決方案。

我試着用正則表達式寫一個php函數,所以我可以將它轉換成html,但它以非均勻的方式轉換,所以很難選擇特定的數據。

也試着寫的mediawiki URL,這樣我可以計劃一些 http://wikitravel.org/en/api.php?format=xml&action=query&titles=Main%20Page&prop=revisions&rvprop=content 但它不工作。

你能幫我解決這個問題嗎?有沒有人成功地刮過維基百科。我有一個教程或任何其他技術,我可以參考。

+1

我不明白。如何讓頁面的HTML幫助你? – svick 2012-03-16 12:37:15

回答