2015-10-15 56 views
0

我有下面的流,當我收到推文時,我想從以下哪個短語和用戶中找到,我收到了推文。找出推文來自哪個短語

stream.filter(track=['python', 'javascript', 'ruby'],follow=['#foo','#bar']) 

是否支持twitter api或tweepy。如果不是什麼是最好的手動方式呢?

Here是一個例子,當鳴叫已收到,我想知道這是不是因爲Python短語或JavaScript或紅寶石,甚至是所有這些的組合來

+0

它會以某種方式不明朗?! – jonrsharpe

+0

不,這不是,因爲我製作的時候我會在一個流中有100-500個短語+我會有50個流,所以當一個流來臨時我不會知道它來自哪裏 – PHA

+0

但是我的觀點是微博將包含你搜索的任何內容,因爲這就是你得到它們的方式,所以只要檢查你正在搜索的內容即可。你究竟在努力實現什麼?如果你需要更精確,爲什麼不用更少的短語來更多的流? – jonrsharpe

回答

0

我相信困惑在於實際瞭解Streaming API。

一旦您打開了一個連接並符合您的要求(如stream.filter(track=['python', 'javascript', 'ruby'],follow=['#foo','#bar'])),Twitter會向您發送符合該條件的所有推文(在其指定限制內​​)。他們做不是做任何類型的分離,你一次收到的一切。

你可以做的是過濾(標記化)這些單詞的每條推文,這可以在你收集你想要的推文數量,或通過某種類型的流媒體,實時方法後完成。

從您提供的示例中,他對推文進行了後處理,並繪製了收集期間收到的所有數據中提及的頻率。

我希望澄清事情。

+0

謝謝,我想知道是否有本地方式,避免手動/後處理,但似乎沒有辦法做到這一點。 – PHA