2011-01-13 105 views
3

我想獲取文章的主要圖像,就像Facebook發佈鏈接時一樣(但沒有選擇圖像部分)。我們需要處理的數據是整個頁面HTML作爲變量。每次運行此功能時,頁面& URL都會有所不同。使用PHP獲取主文章圖像

是否有任何圖書館或課程特別擅長獲取內容的主體,就像Instapaper會有什麼幫助?

+0

請解釋一下你的意思「的內容主體」和「製品的主要形象」是什麼。你如何確定什麼是「主」? DIV中的第一張或最大圖片佔用了屏幕上最多的空間? – rik 2011-01-13 12:49:25

+0

當我說內容的主體時,我指的是文章的自我,文章,新聞故事。而通過主圖像,通常是文章標題旁邊的圖像。 – PaulAdamDavis 2011-01-13 12:56:49

回答

2

您可以使用PHP DOM類來解析HTML頁面。它很容易讓你抓住第一張圖片和h1文字。

你也可以更高級的使用它,比如循環遍歷p標籤,找到第一個具有超過X個字符的p標籤,並將其用於主文本。或者你可以抓住元標籤並獲得描述。

這裏有大約一百萬種不同的方式,但PHP DOM可能是您最初想要的。

http://us.php.net/manual/en/book.dom.php