2012-02-22 65 views
2

我一直在嘗試瞭解過去2天的MediaWiki文檔,我無法弄清楚如何通過MediaWiki API檢索維基百科文章的第一段。檢索維基百科文章的第一段

難道有人指着我正確的方向嗎?

我即將呼籲file_get_contents,但我確信有一個「更乾淨」的解決方案。

+0

你想他們的[沙箱(http://en.wikipedia.org/wiki/Special:ApiSandbox)? – yoavmatchulsky 2012-02-22 12:03:51

+0

再次查看它後,您不需要API即可查看該頁面並獲取第一段。 – yoavmatchulsky 2012-02-22 12:09:30

回答

2

file_get_contents非常乾淨,您將獲得HTML代碼。 然後,您可以使用DOMDocument解析html代碼。 DOMDocument作爲JavaScript,你可以在div中獲取所有<p>的例子。 或搶第一個。

例如:

$html = file_get_contents('the url'); 

$dom = new DomDocument(); 
@$dom->loadHTML($html); 

$p = $dom->getElementsByTagName('p')->item(0)->nodeValue;