2013-04-26 111 views
0

我想實現類似網址刮板的Facebook。你進入網站url和facebook的那個取得視頻或圖像,標題,描述形式的頁面。 Facebook使用og:meta標籤來抓取網站。臉譜讓我們使用他們的網址刮板或網址調試器。他們有什麼其他方式可以做到這一點?Facebook的網址刮板

我試過使用雅虎查詢語言。但它不會返回元標記的屬性。

回答

2

試試這個寶石https://github.com/intridea/opengraph

它解析頁面並提取OG信息:

require 'opengraph' 

movie = OpenGraph.fetch('http://www.rottentomatoes.com/m/1217700-kick_ass/') 

movie.title # => 'Kick-Ass' 
movie.movie? # => true 
movie.image # => 'http://images.rottentomatoes.com/images/movie/custom/00/1217700.jpg' 
+0

感謝。但是,這個寶石的問題是,它只適用於頁面有og信息。 – 2013-04-29 06:37:34

+0

如果你想像FB一樣刮一個普通的頁面,你需要解析整個DOM來尋找你需要的標籤。 AFAIK Facebook尋找圖片,視頻,並獲得標題和描述。我不知道是否有一些模擬fb刮板行爲的gem,但可以使用像[Nokogiri](http://nokogiri.org/)這樣的DOM解析器,並輕鬆實現自己的邏輯。 – marquez 2013-04-29 08:54:14

+0

嘿謝謝。我最終也這樣做。我正在尋找一些更簡單的客戶端替代方案。但它確定,我會用服務器端來做。 – 2013-04-29 09:28:59