2017-04-19 76 views
0

我必須安裝在https://github.com/TargetHolding/pyspark-cassandra 可用的pyspark-cassandra連接器,但我遇到了巨大的問題和錯誤,並沒有支持關於用python進行火花的文件,這種文件叫做pyspark! 我想知道的是pyspark-cassandra-connector包被depricated或別的東西?另外,我需要爲git clone pyspark-cassandra-connector軟件包提供清晰的分步教程,安裝並將其導入到pyspark外殼中,並與cassandra成功連接並進行交易,通過pyspark構建表格或密鑰空間並對其產生影響。pyspark卡桑德拉連接器

回答

-1

,你可以用它來連接到卡桑德拉

import com.datastax.spark.connector._, org.apache.spark.SparkContext, org.apache.spark.SparkContext._, org.apache.spark.SparkConf 
val conf = new SparkConf(true).set("spark.cassandra.connection.host", "localhost") 
val sc = new SparkContext(conf) 

你可以這樣寫 如果你調用測試,並呼籲MY_TABLE表

val test_spark_rdd = sc.cassandraTable("test", "my_table") 
test_spark_rdd.first 
+0

他明確詢問有關pyspark連接器和您的答案是使用scala .. – Pushkr