ff

    3熱度

    1回答

    從save.ffdf的文檔: 使用「save.ffdf」自動地設置的FF「的的終結器的‘’ 向量‘‘關閉’’。這意味着當對象被刪除或R會話關閉時,數據將保留在 磁盤上。數據可以 被刪除或者使用「刪除」或通過除去其中 對象被保存(「DIR」)的目錄。 我想先從一個小的ffdf數據框開始,一次添加一些新數據,然後將它放在磁盤上。所以,我做了一個小實驗: # in R ffiris = as.ffdf

    0熱度

    1回答

    我正在嘗試使用「ff」包讀取大文件(1.51 GB)。下面的命令使用: atmins = read.csv.ffdf(file="atmins.csv", header=TRUE, VERBOSE=TRUE, first.rows=10000, next.rows=50000, colClasses=NA) 然而,一段時間後,我收到以下錯誤: Error in UseMet

    0熱度

    1回答

    我在更大的數據集中執行以下操作時遇到問題。我想知道是否有內置的方法來使用ff或ffdf來完成它。 實施例: require(ffbase) > iris Sepal.Length Sepal.Width Petal.Length Petal.Width Species 1 5.1 3.5 1.4 0.2 setosa 2 4.9 3.0 1.4 0

    6熱度

    2回答

    我在這裏的「大數據處理」裏面比較新,希望能找到一些關於如何處理50 GB csv文件的建議。目前的問題是以下幾點: 表看起來像是: ID,Address,City,States,... (50 more fields of characteristics of a house) 1,1,1st street,Chicago,IL,... # the first 1 is caused by w

    0熱度

    2回答

    我可否輕鬆地刪除ffdf對象的列? library(ff);library(ffbase) irisdf=as.ffdf(iris) 如何只包含Sepal.length和Species列?

    0熱度

    1回答

    我有一個很大的(23 Mln行)ffdf表(tbl_ffdf),有10列,其中7個是因子,3個包含數字。它看起來是這樣的: TABLE_bad F1 F2 F3 F4 F5 F6 F7 N1 N2 N3 1111 01.15 05.14 busns AA 16 F 55.2 16165 0 1111 01.15 05.14 busns AA 16 F

    1熱度

    1回答

    我想使用ffdf複製以下一對多連接。什麼是最好的方法來做到這一點? 下面我使用data.tables提供了一個我想要得到的例子。我知道merge.ffdf函數的以下說明: 「此方法與基礎包中的合併相似,但只允許內部和外部外部聯接。請注意,聯接是基於ffmatch或ffdfmatch完成的:僅限於y中的第一個元素將被添加到x「。 但是,我想知道是否有解決方法。 > A <- data.table(c

    1熱度

    1回答

    我試着給我的ffdf添加一個Source列,但似乎無法讓它工作......如果它是一個正常的df我會簡單地寫 mtcars$NewCol <- "AB" 如果我這樣做了ffdf它返回一個錯誤 require(ff) require(ffbase) mtcarsff <- as.ffdf(mtcars) mtcars$NewCol <- "testname" Error in `[[

    0熱度

    1回答

    我有一個ff dataframe變量,它的名字是在循環的每次迭代中在代碼中創建的。我想將此變量的rownames設置爲NULL,但下面的代碼不起作用。有人可以提出一個解決方案嗎? a="foo" row.names(eval(parse(text=paste(a, "_USD.ff", sep="")))) <- NULL

    1熱度

    1回答

    晚上好, 我試圖將數據集加載爲R時(〜20點密耳的行,140〜COLS 6.2gb在磁盤上),使用任一的LaF和ffbase或FF。無論哪種情況,加載都會失敗。 struct <- detect_dm_csv(file = '/scratch/proj.csv', header = TRUE) colClasses <- struct$columns[,2] ldat <- laf_open(