我正在運行安裝了gcc
的Lubuntu 16.04機器。我沒有得到gensim
與cython
一起工作,因爲當我訓練一個doc2vec model
時,它只能訓練一名工作極其緩慢的工人。如何讓cython和gensim與pyspark一起工作
正如我所說的gcc
是從一開始就安裝的。然後我可能犯了錯誤,並在cython
之前安裝了gensim
。我通過強制重新安裝gensim
通過pip
糾正了這個問題。即使只有一名工人也沒有效果。
機器設置爲spark
主控制器,我通過pyspark
與spark
對接。它的工作原理是這樣的,pyspark
使用jupyter
和jupyter
使用python 3.5。這樣我就可以得到一個jupyter
接口到我的集羣。現在我不知道這是爲什麼我不能得到gensim
與cython
一起工作的原因。我不在集羣上執行任何gensim代碼,只需要啓動jupyter
也可以執行gensim
。
據我所知,從gensim頁面可以看出,它與Cython無關。你究竟在做什麼,是什麼讓你認爲Cython和gensim一起? – DavidW
仔細一看,gensim確實有一些可選的用Cython編寫的更快的版本,但你不需要自己安裝Cython(生成的C文件看起來被提供,所以你只需要GCC)。如果您不具備C模塊,則無法構建C模塊並在導入時出現警告,它還會在安裝時提供警告。你有沒有得到這些警告? – DavidW
我在word2vec教程中閱讀:_工人蔘數只有在您安裝了Cython時纔有效。沒有Cython,你只能使用一個核心,因爲GIL(而word2vec訓練將會非常慢)._ [here](https://rare-technologies.com/word2vec-tutorial/)並且沒有I至少當我通過pip來完成時,不會有任何構建錯誤。 – Thagor