0
該代碼循環遍歷nltk庫中的word.words()中的每個單詞,然後將該單詞推入數組中。然後它檢查數組中的每一個單詞,通過使用相同的庫來查看它是否是實際的單詞,並且不知何故許多單詞是不真實的,如「adighe」。這裏發生了什麼?nltk語料庫的Words.word()似乎包含奇怪的無效單詞
import nltk
from nltk.corpus import words
test_array = []
for i in words.words():
i = i.lower()
test_array.append(i)
for i in test_array:
if i not in words.words():
print(i)
啊,謝謝。不知道爲什麼我沒有嘗試刪除行i = i.lower()。不管怎麼說,還是要謝謝你。 –