2012-04-28 144 views
1

我很清楚這個話題已經被深入討論過了(我全天讀了很多)。Facebook頁面抓取/訪問令牌

不過,FB有可能允許我爲非商業性,非公立的研究型大學項目創建前端爬行程序的可能性如何?

我的爬蟲應該反覆查找數量非常有限的特定公衆粉絲頁面,並收集粉絲數量,狀態更新以及喜歡數量和每條評論數量等匿名數據。

我想展示的是媒體頁面中的哪些主題是「喜歡的」,並且討論得最多,以及隨着時間的推移如何發展。我知道FB的限制TOS。感謝您對此的看法。

第二個問題涉及技術方法/授權:讀取粉絲頁面的粉絲數量,狀態更新以及它們的喜歡數量 - 我甚至可以使用API​​/OpenGraph作爲這樣的爬蟲嗎?我認爲對於閱讀頁面牆,你需要一個訪問令牌,不惜任何代價,並通過應用程序實現自動「爬蟲」,因此是不可能的我猜(應用程序只對用戶的行爲做出反應,並且不能像cron作業那樣) ?

正如你所看到的,我對於FB開發和邏輯非常新穎。非常感謝您的專業知識。

回答

0

如果你主要針對公共頁面,那麼你應該沒問題。

你需要有一個facebook應用程序,然後你可以從你的程序authenticate as the app。 您將獲得一個應用程序令牌,您應該可以使用它來抓取公共頁面數據。

如果選中了Page object的文檔,你會表(字段和連接),大部分什麼在權限列是「無法訪問令牌或用戶的access_token」或「任何有效的access_token或見用戶access_token「,如果你有應用令牌,那你就很好。

此外,我認爲這是您感興趣的內容,Page對象具有「talking_about_count」字段。

所以,是的,你可以做到這一點,至少大部分。 至於TOS,由於所有這些都完全正確並且直接來自他們的官方文檔,所以沒有問題。