2017-07-27 85 views

回答

0

我建議你在Windows上使用IntelliJ IDEA開發Spark。創建一個SBT項目,您可以在其上覆制構建文件上的下一個代碼,它將爲您下載所有的依賴關係。

version := "1.0" 
scalaVersion := "2.10.6" 
// grading libraries 
libraryDependencies += "junit" % "junit" % "4.10" % "test" 

libraryDependencies ++= Seq(
    "org.apache.spark" %% "spark-core" % "1.6.3", 
    "org.apache.spark" %% "spark-sql" % "1.6.3", 
    "org.apache.spark" %% "spark-hive" % "1.6.3" 
) 

libraryDependencies ++= Seq(
    "org.apache.commons" % "commons-csv" % "1.4", 
    "joda-time" % "joda-time" % "2.9.9", 
    "com.univocity" % "univocity-parsers" % "1.5.1" 
) 
libraryDependencies +="com.databricks" %% "spark-csv" % "1.5.0" 

之後,創建一個scala對象,並開始開發。它主要用於Spark的本地開發。讀取或寫入文件時請注意路徑。