我有一個5列和約18,000,000行的數據集。我需要根據第1列中的值分離數據,第1列中的值是1到1000之間的數字,並且它們會重複一定次數,而不會互相排斥。我如何使用for循環分隔數據,爲第1列中的每個數字創建nX5數組,即,如果1來到60次,我應該有60X5的矩陣。它應該查找該數字,並將所有這些實例分隔開來。我一直在嘗試循環在R程序
for (i in 1:2) A[i] <- Data[ which(Data$Column=='i')]
但什麼也沒有發生。 [A]矢量仍爲空,我無法提取數據。
'$的數據列=='i''字面檢查‘我’不是變量i的值。 –
如果您擁有如此多的數據行,請嘗試使用'data.table' .http://datatable.r-forge.r-project.org/datatable-intro.pdf http://user2014.stat.ucla .edu/files/tutorial_Matt.pdf – 2015-10-15 08:36:27
@Deena,這是一個古老的鏈接。請參閱github上的[data.table項目頁面wiki](https://github.com/Rdatatable/data.table/wiki)。 – Arun