java.lang.NumberFormatException：對於輸入字符串：Y400sX902：使用Spark Kmeans

我試圖使用spark MLlib -kmeans來對產品數據集進行聚類。但是，我的第一列即ID以Y400sX902開頭，當我運行下面的代碼時，它會拋出一個錯誤，因爲NumberFormatException。我對這項技術很陌生，如果有任何幫助的話，那就太棒了。謝謝。java.lang.NumberFormatException：對於輸入字符串：Y400sX902：使用Spark Kmeans

object KMeansExmp { 

def main(args: Array[String]) { 

val conf = new SparkConf().setMaster("local[1]").setAppName("KmeansApp"); 
val sc = new SparkContext(conf); 

val rawData = sc.textFile("/Users/Downloads/data.csv") 
val header = rawData.first 

val rows = rawData.filter(l => l != header) 

val extractedFeatureVector = rows.map { row => Vectors.dense(row.split(',').map(_.toDouble).slice(2, 5)) } 


val numberOfClusters = 3 
val numberOfInterations = 50 

val model = KMeans.train(extractedFeatureVector, numberOfClusters, numberOfInterations) 

model.clusterCenters.foreach(println) 

}

錯誤：

java.lang.NumberFormatException: For input string: ""Y400sX902"" 
    at   sun.misc.FloatingDecimal.readJavaFormatString(FloatingDecimal.java:1250) 
    at java.lang.Double.parseDouble(Double.java:540) 
    at scala.collection.immutable.StringLike$class.toDouble(StringLike.scala:232) 
    at scala.collection.immutable.StringOps.toDouble(StringOps.scala:31) 
    at KMeansExmp$$anonfun$2$$anonfun$apply$1.apply(KMeansExmp.scala:22) 
    at KMeansExmp$$anonfun$2$$anonfun$apply$1.apply(KMeansExmp.scala:22) 
    at ........

來源

2016-04-27 SuraJ

嘗試

val rows = rawData.drop(1)

代替過濾整個RDD去除第一行（即非數字標頭）。

來源

2016-04-28 07:12:04 elm

java.lang.NumberFormatException：對於輸入字符串：Y400sX902：使用Spark Kmeans

回答

相關問題