有人可以告訴我這段R代碼是幹什麼的嗎？

-5

set.seed(1234) 
dataPartition <- sample(2,nrow(data),replace=TRUE,prob=c(0.7,0.3))  
trainData <- data[dataPartition ==1,] 
testData <- [dataPartition ==2,]

來源

2017-04-19 Sharon Luk

爲什麼你不運行它並找出？ – EJoshuaS

它將您的數據分成兩組。

 sample(2,nrow(data),replace=TRUE,prob=c(0.7,0.3))

您在由1和2組成的矩陣的長度中抽取一個向量，其概率爲0.7和0.3。

 trainData <- data[dataPartition ==1,] 
     testData <- data[Partition ==2,] ## Fixed the brackets

這只是將您的數據分成兩個，以便能夠（我假設）驗證模型。這裏有一個更詳細的答案，爲什麼將你的數據分爲火車和測試 https://stats.stackexchange.com/questions/19048/what-is-the-difference-between-test-set-and-validation-set

來源

2017-04-19 13:22:30

有人可以告訴我這段R代碼是幹什麼的嗎？

回答

相關問題