我有一些代碼可以從我的數據集中刪除停用詞,因爲停止列表似乎並沒有刪除我希望的大多數單詞,我正在尋找將單詞添加到這個停止列表,以便它將在這種情況下刪除它們。 我使用去除停止詞的代碼是:添加單詞到nltk stoplist
word_list2 = [w.strip() for w in word_list if w.strip() not in nltk.corpus.stopwords.words('english')]
我不能確定正確的語法用於添加的話,似乎無法在別處找到正確的一個。任何幫助表示讚賞。謝謝。
任何良好的英語停止字在那裏編輯它? nltk一個似乎很差 – fabrizioM 2011-04-01 11:15:38
@fabrizioM http://fs1.position2.com/bm/txt/stopwords.txt這是我在我上次公司使用的名單.. – Rafi 2011-04-01 11:23:14
@Rafi這是一個比NLTK !謝謝! – 2015-09-18 23:36:16