我有一個字符串列表,我想刪除每個字符串中的停用詞。問題是,停用詞的長度比字符串長得多,我不想重複比較每個字符串和停用詞列表。 python中有多種方式可以同時使用這些多個字符串嗎?python同時處理多個字符串
lis = ['aka', 'this is a good day', 'a pretty dog']
stopwords = [] # pretty long list of words
for phrase in lis:
phrase = phrase.split(' ') # get list of words
for word in phrase:
if stopwords.contain(word):
phrase.replace(word, '')
這是我目前的方法。但是這意味着我必須經歷列表中的所有短語。有沒有一種方法可以用一次比較來處理這些短語?
謝謝。
「長」要多長時間?如果它不到10萬個元素,我不會擔心。特別是如果你將'stopwords'放入一個集合中,因爲'set in set x'檢查速度非常快。 – Kevin 2014-12-05 16:26:31
一個嵌套的列表理解陳述可能會更好(或更混亂?)看,但這是非常好的方式,我可以看到做到這一點 – TehTris 2014-12-05 16:28:59
@Kevin嗯,它是10萬長,但仍然不想以檢查多次.. – JudyJiang 2014-12-05 16:29:41