2009-04-24 84 views
3

的學位,我可以使用哪些準備提供算法,數據挖掘Twitter要找出2人在Twitter之間的分離度。Twitter的數據挖掘:分離

當社交圖譜不斷變化和不斷更新它是如何改變。

,然後在那裏我可以使用,而不是讓這麼多的API調用來重新開始的Twitter社交圖的任何數據轉儲。

回答

0

有提供對社交圖譜的轉儲一個公司,但它記錄下來,並不再可用。正如你已經意識到的那樣 - 這有點困難,因爲它一直在變化。

我會建議您檢查出他們social_graph API方法,他們給用最少的API調用最爲信息。

5

Twitter API

What's the Data Mining Feed and can I have access to it?

The Data Mining Feed是我們/狀態/ public_timeline REST API方法的擴展版本。它返回600個最近的公共狀態,一次緩存一分鐘。您可以每分鐘申請一次,以獲取Twitter上公共狀態的代表性樣本。我們爲研究人員和業餘愛好者提供免費服務(並且不提供服務質量保證)。我們所要求的是,您提供了您的研究或項目的簡要說明以及您要求提供此源的IP地址;只需填寫此表格。請注意,數據挖掘Feed並非旨在提供Twitter上所有公共更新的連續流;請參閱上文以獲取有關即將推出的「firehose」解決方案的更多信息。

,也看到:Streaming API Documentation

+0

的權利..但是..算法? – Bluu 2009-04-25 18:59:45

0

有可能是做這件事的其他方式,但我剛剛花了近10分鐘時間瀏覽做類似的東西和這Q.跌跌撞撞

我會用一個無向(&加權 - 因爲我想要的查看位置)圖 - 在py中使用JgraphT或類似; JGraphT是基於Java的,但包含不同的預寫算法。

然後,您可以使用名爲BellmanFord算法;需要一個整數輸入,並在圖中搜索具有整數輸入的最短路徑,並且只有整數輸入,與Dijkstras不同。

http://en.wikipedia.org/wiki/Bellman%E2%80%93Ford_algorithm

我最近用它在飛行路徑的一個項目,迭代高達找到最短的最短路徑「跳」(邊緣)。