2016-07-15 766 views
2

我試圖安裝使用pysparkpip install像下面。但我有以下錯誤。pyspark:PIP安裝找不到一個版本

(python_virenv)edamame$ pip install pyspark 
Collecting pyspark 
    Could not find a version that satisfies the requirement pyspark (from versions:) 
No matching distribution found for pyspark 

有沒有人有什麼想法?謝謝!

回答

2

pyspark是不是在PyPI中,所以你不能直接使用pip install安裝它。

相反,你可以在這裏下載星火的適當版本:http://spark.apache.org/downloads.html,你會得到一個壓縮的TAR文件。然後將其解壓縮,pyspark位於其python文件夾中。

要打開星火殼的Python版本,你可以進入你的星火目錄,鍵入:

bin/pyspark 

bin\pyspark 
在Windows

1

PySpark可以通過以下方式安裝。

下載火花來自:Spark Downloads

下載並解壓縮文件。轉至文件夾,並執行

./bin/pyspark 

您可能要添加的bin文件夾在你的shell的$PATH變量爲好。

或者,

您可以從CDH分佈安裝:

+0

謝謝!是否有可能將它添加到我的虛擬環境? – Edamame

+0

你應該可以。我不確定它是否會特別有用。你可以參考cloudera的鏈接:http://blog.cloudera.com/blog/2015/09/how-to-prepare-your-apache-hadoop-cluster-for-pyspark-jobs/ – srjit

5

從Spark 2.2開始,PySpark現在可以在PyPI中使用。

pip install pyspark


火花2.1,PySpark是一封來自PyPI,這是在考慮用於本ticket 2.2 PIP安裝但尚未。要安裝PySpark,現在只需要下載Spark 2.1+並運行setup.py:

cd spark-2.1/python/ 
pip install -e . 

非常感謝@霍爾登!