dplyr

    2熱度

    1回答

    我想使用data.table包的fast fread函數來加載一個巨大的csv文件。加載後,我想將一個字符串變量轉換爲一個因子。但是,當我想要做的加載文件這樣一個發生變異: library(data.table) library(dplyr) df <- fread("df.csv") df <- mutate(df, name = as.factor(name)) 我得到這個錯誤:

    0熱度

    1回答

    我的初衷動態輸入編程要做到這一點是dplyr整合閃亮 此前0.3我已經使用EVAL良好做法(解析(文= ....)), do.call()方法。 在0.3,我看到兩個選項,例如: var <- c('disp','hp') select_(mtcars,.dots = as.lazy_dots(var)) select(mtcars,one_of(var)) 但哪一個更好?我打算通過Shi

    0熱度

    2回答

    如何從dplyr中的任何(常規)SQL查詢中接收完整結果?這是一個玩具示例,其中SQL查詢只是返回完整的表格。 library("plyr") library("dplyr") ## connect to a database hflights_sqlite <- tbl(hflights_sqlite(), "hflights") my_con <- src_sqlite(hfligh

    3熱度

    1回答

    我的問題是一些包共享相同的函數名稱。我如何告訴R我想從哪個包使用這個功能? 我試圖加載我想在代碼中再次使用的包,但它仍然無法正常工作。我的情況是selectMASS和dplyr。我想用dplyr但錯誤總是unused argument ...

    7熱度

    2回答

    我有血壓記錄的縱向跟蹤。 某個點的值比移動平均值(滾動平均值)的預測性要低,這就是我爲什麼要計算它的原因。數據看起來像 test <- read.table(header=TRUE, text = " ID AGE YEAR_VISIT BLOOD_PRESSURE TREATMENT 1 20 2000 NA 3 1 21 2001 129 2 1 22

    2熱度

    2回答

    我有一個數據框,我想用dplyr的mutate()函數創建一個新列prob。 prob應包含概率P(行值>所有列值),表示數據框中行數比每行的值大。這是我想做的事: data = data.frame(value = c(1,2,3,3,4,4,4,5,5,6,7,8,8,8,8,8,9)) require(dplyr) data %>% mutate(prob = sum(value <

    2熱度

    1回答

    在dplyr::do(),有沒有辦法像其他dplyr函數一樣訪問.data上下文中的變量?例如,假設我有一個數據幀: > dd <- data.frame(a=1:5) mutate(),以及其他功能,工作原理,這樣的表達在數據幀的情況下進行評估: > mutate(dd,a2=a*2) a a2 1 1 2 2 2 4 3 3 6 4 4 8 5 5 10 但不是do

    1熱度

    2回答

    我想總結列的每個總和,按A或B GG的因素平等summarise_each分組 > gg A B a1 a2 a3 1 c2 c1 1 5 9 2 c1 c3 2 6 10 3 c4 c2 3 7 11 4 c3 c2 4 8 12 得到 > test AB a1 a2 a3 1 c1 3 11 19 2 c2 8 20 32 3 c3 6 14 22 4

    6熱度

    6回答

    我有一個看起來像這樣的數據集。 bankname bankid year totass cash bond loans Bank A 1 1881 244789 7250 20218 29513 Bank B 2 1881 195755 10243 185151 2800 Bank C 3 1881 107736 13357 177612 NA Bank D 4 1881

    -1熱度

    1回答

    有之間的值的條件的選擇是一個矩陣: A B 0 36 0 4 4 24 0 13 0 11 11 13 0 6 6 20 0 12 12 20 0 11 0 33 33 40 0 31 0 5 5 39