我試圖從另一個數據集以間隔來創建一個新的數據集其他數據集的部分星火數據集,例如,考慮數據集1作爲輸入,並dataset2作爲輸出:創建
dataset1 = [1, 2, 3, 4, 5, 6]
dataset2 = [1, 2, 2, 3, 3, 4, 4, 5, 5, 6]
我能夠做到使用數組,但對於mlib數據集是必需的。
我與陣列碼:
def generateSeries(values: Array[Double], n: Int): Seq[Array[Float]] = {
var res: Array[Array[Float]] = new Array[Array[Float]](m)
for(i <- 0 to m-n){
res :+ values(i to i + n)
}
return res
}
FlatMap似乎是要走的路,但如何功能可以搜索數據集中的下一個值?
你可以發佈給定數據集的預期輸出嗎? – BDR
@BDR感謝您的回答,給出了問題描述中的數據集1我想獲取數據集2 –
您的意思是說您的數據集1是您的輸入,預期輸出是數據集2?它做對了嗎? – BDR