我有一個新聞聚合器Newzupp,我想修改。現在我只是展示新聞報道的標題,並將其鏈接到他們的網站。如何檢索博客文章/新聞文章的主要圖像?
我打算通過使用圖像+標題而不是普通標題來使其更加圖形化。我想知道如何獲得每篇文章的主要圖像(有點類似於google新聞)。
我能想到的一種方法是我可以去除所有圖像並顯示指向同一文章的圖像。但我認爲這不會有效。有沒有其他的方式來做到這一點?
我找到了解決辦法。
- 獲取網址[HTML/XML]內容
- 刮使用hpricot
- 查找與標籤「IMG」的所有元素
- 做一些研究,以找到他們的主要內容顯示圖像。 [喜歡Wired.com的RSS訂閱第6張圖片]
我仍然認爲這是非常低效的。我想知道Google新聞服務如何刮掉網站/博客並顯示相關圖片。
酷...可能與一些網站合作..但就像我說的,在有線的第六影像畫面的情況下..這是人們嵌入谷歌廣告的其他網站相同之後h1標籤 – Jagira 2010-07-05 07:06:29