-5
set.seed(1234)
dataPartition <- sample(2,nrow(data),replace=TRUE,prob=c(0.7,0.3))
trainData <- data[dataPartition ==1,]
testData <- [dataPartition ==2,]
set.seed(1234)
dataPartition <- sample(2,nrow(data),replace=TRUE,prob=c(0.7,0.3))
trainData <- data[dataPartition ==1,]
testData <- [dataPartition ==2,]
它將您的數據分成兩組。
sample(2,nrow(data),replace=TRUE,prob=c(0.7,0.3))
您在由1和2組成的矩陣的長度中抽取一個向量,其概率爲0.7和0.3。
trainData <- data[dataPartition ==1,]
testData <- data[Partition ==2,] ## Fixed the brackets
這只是將您的數據分成兩個,以便能夠(我假設)驗證模型。 這裏有一個更詳細的答案,爲什麼將你的數據分爲火車和測試 https://stats.stackexchange.com/questions/19048/what-is-the-difference-between-test-set-and-validation-set
爲什麼你不運行它並找出? – EJoshuaS