好的,這有點破解,但這是我必須做的,才能夠在我的Mac筆記本電腦上運行Python 3.x中的各種NLTK數據文件(運行macOS 10.12.2)。
首先,請注意,證書錯誤只發生在我使用Python 3.x在我的Mac上下載NLTK數據時(我使用Python 3.x時,VirtualBox內的Ubuntu VM沒有這樣的錯誤 - 這很煩人) 。爲什麼這會導致我Mac上的錯誤超出我的意料之外,尤其是當NLTK模塊使用pip
安裝到Python 3.x中時,沒有任何問題。這是連接到NLTK的下載服務器,似乎導致SSL驗證問題。
我的'啊哈!'當我意識到NLTK(當安裝到Python 3.x或Python 2.x中)在任何計算機上安裝的所有Python版本之間共享相同的目錄結構時,我就開始了。因此,我使用預裝在macOS上的Python 2.x來安裝NLTK,然後在Python 2.x中使用nltk.download()
來安裝沒有問題的停用詞語集。這樣做之後(在Python 2.x的),我就回成Python 3.x和這個代碼工作:
import nltk
from nltk.corpus import stopwords
print(stopwords.words('english'))
正如我所說,這是一個黑客攻擊的一位,但這種技術可以讓我得到使用Python 2.x安裝的NLTK數據,我可以根據需要使用Python 3.x進行處理。
您確定您使用的是最新版本的nltk,也許嘗試nltk.download('all') – SAMO
不是沒有工作 –
http://stackoverflow.com/a/37053858/1168680 – RAVI