0
我有特殊字符,如在一個數據集如下所示:去除數據框中行
! Hello World. 1
" Hi there. 0
我想要做的,是從每一行的開頭(剛從刪除所有的特殊字符開始,而不是特殊字符的其餘部分)。
爲了讀取數據(製表符分隔)我使用下面的代碼:
val data = sparkSession.read.format("com.databricks.spark.csv")
.option("delimiter", "\t")
.load("data.txt")
val columns = Seq("text", "class")
val df = data.toDF(columns: _*)
我知道,我應該使用replaceAll()
但我不太清楚如何做到這一點。