2011-04-09 114 views
2

如何通過PHP獲取網頁內容?我如何抓取博客文章的文本,因爲大多數RRS feed只給出文章的鏈接,所以我不能使用它。是否有這樣或那樣的PHP函數呢?請提供一些建議:)。通過PHP獲取網站內容

+0

你試過谷歌嗎? – 2011-04-09 23:40:08

+0

如果您有要從中獲取內容的URL,請嘗試閱讀以下優秀主題:http://stackoverflow.com/questions/3650125/how-to-parse-html-with-php - 還有另一個問題與鏈接到我無法找到的HTML解析選項。 – Daniel 2011-04-09 23:41:07

+0

丹尼爾的建議是好的,在我的回答下面我發佈了一個鏈接到一個漂亮的HTML分析器/屏幕抓取庫,可能會幫助(或必要!)來實現您的最終目標。 – Eric 2011-04-09 23:42:04

回答

8

要只需要加載一個網頁,HTML和一切,你可以在網址使用的fopen:

$page = file_get_contents('http://www.blog.com/one-example-post'); 

對於網頁的更先進的裝卸,捲曲庫將互動更巧妙地與遠程服務器(例如,如果有HTTP認證,或者它是一個https頁面)。

一旦你有了頁面的內容,你可能需要做一些screen scraping(又名網絡抓取)......並且你很幸運,因爲我只是爲另一個項目做了這個。 Here's a great library,我發現,以幫助這種骯髒的技術。祝你好運。