2016-06-09 109 views
1

我正在使用Tweepy(python的REST API客戶端),我試圖通過幾個關鍵字找到推文,並且沒有包含在推文中的網址。Tweepy API搜索沒有關鍵字

但是搜索結果不符合我們的滿意度。看起來像查詢有誤,並已停止。此外,我們觀察到結果不是像以前那樣在100個批量包中返回。

您能否告訴我爲什麼此搜索無法正常工作?

我們希望獲得所有推文中提及'亞馬遜'的文章中沒有任何URL鏈接。 我們使用下面顯示的搜索。搜索結果仍包含帶有URL的推文或不含「亞馬遜」關鍵字的推文。

請讓我們知道我們做錯了什麼?

auth = tweepy.AppAuthHandler(consumer_key, consumer_secret) 
api = tweepy.API(auth, wait_on_rate_limit=True, wait_on_rate_limit_notify=True) 
searchQuery = 'Amazon OR AMAZON OR amazon filter:-links' # Keyword 

new_tweets = api.search(q=searchQuery, count=100, 
         result_type = "recent", 
         max_id = sinceId, 
         lang = "en") 

回答

1

減號前應「過濾器」可以說,沒有之前的「鏈接」,像這樣: searchQuery = 'Amazon OR AMAZON OR amazon -filter:links'

而且,我懷疑count = 100選項是有效的,因爲它不是列在API documentation(儘管這可能不是最新的)。嘗試用rpp = 100替換,以獲取批量包中的推文。

我不確定爲什麼有些您發現的推文不包含「亞馬遜」關鍵字,但可能是「亞馬遜」包含在海報的用戶名中。我不知道你是否可以直接在查詢中過濾,或者即使你想過濾它,因爲這意味着你會拒絕來自官方Amazon賬戶的推文。我建議,對於查詢返回的每條推文,您都要檢查它是否確實包含「亞馬遜」。

+0

這工作。不知道爲什麼這不被標記爲答案。 – ThinkCode