2017-10-11 48 views
0

我實現一個類來存儲鳴叫下降銳推:在數據幀

class Twitter_User(): 
    def __init__(self,id,count=200): 
     self.id = id 
     self.count = count 
    def get_tweets(self): 
     store_tweets = api.user_timeline(self.id, count=self.count) 
     simple_list = [] 
     for status in store_tweets: 
      array = [status._json["text"], status._json["favorite_count"], status._json["created_at"],status._json["retweet_count"]] 
      simple_list.append(array) 
     data = pd.DataFrame(simple_list, columns=["Text", "Like", "Created at","Retweet"]) 
     return data 

現在我想通過文字刪除colums所有銳推(文字,與「RT」開頭),我怎麼能得到這個?與正則表達式和應用還是有更簡單的方法?

回答

1

通過使用str.startwith

df[~df.text.str.startswith('RT')] 
+0

@LimeInTheCoconut然後你需要證明你的樣本數據 – Wen

+0

確定現在的工作對不起,我把self.rt =真默認初始化,以及條件是否self.rt = = False then df = df [〜df.text.str.startswith('RT')]。在返回數據之前刪除這個條件並放置代碼看起來很有用 –