dplyr

    2熱度

    1回答

    我有一個大data.frame(DF)這樣轉換三分位數爲二進制: A B C D E 1.2 2.2 3.3 4.4 5.2 4.2 5.3 6.5 7.2 1.5 2 7 3 4 6 1 2 3 4 5 ,我想通過R中使用dplyr能夠創建列B的三分位數組驗證碼: 首先 library('dplyr') ntile(df$B, 3) 於是,我從B列三組: #group 1 n

    1熱度

    1回答

    我是新來的R和我有一個很難理解,使下面的代碼片段功能%%運營商: fMatrix <- DT[c(v1,v2), ] %.% select(f1,f2,f3) %.% lapply(...) 邏輯上,這似乎是有道理的,因爲它可能(可能)試圖通過某種方法鏈接使用(點運算符)來獲取子集並執行某些操作。問題是我的R解釋器不​​識別%.% 我猜測運算符來自我沒有導入的包或類似的東西。任何見解都值得歡迎

    0熱度

    1回答

    當使用帶有日期變量的數據框時,我正面臨着ggplot2 faceting和dplyr group_by的錯誤。如果我首先轉換日期變量,然後融化數據框,則只會發生此錯誤。如果我做的是相反的,那麼變量看起來是完全一樣的,但不會給出錯誤。舉個例子: #base df df <- data.frame( id = c("A", "B", "C"), date1 = c("12/Sep/2010", "

    41熱度

    3回答

    是否有可能從dplyr庫使用select功能的data.frame列選擇所有獨特值? 例如SQL表示法中的「SELECT DISTINCT field1 FROM table1」。 謝謝!

    1熱度

    1回答

    我有一個數據框,其中包含不同用戶每週的頁面瀏覽次數。它看起來像這樣: Userid week views eerr 24 1 dd 24 2 dd 25 1 ... 我想繪製每週的平均頁面瀏覽量。但是,我想根據用戶在第一週內瀏覽的頁面數來對用戶進行分組,以便爲​​具有不同活動級別的用戶繪製單獨的軌跡。我可以通過做 weekdf = df %>% group_by(Userid) %

    0熱度

    3回答

    下面是一個示例數據集。 a <- structure(list(ID = c("A1", "A2", "A3", "A1", "A1", "A2", "A4", "A5", "A2", "A3"), Type = c("A", "B", "C", "A", "A", "A", "B", "B", "C", "B"), Alc = c("E", "F", "G", "E", "E", "E",

    0熱度

    3回答

    我想了解一個data.frame一些彙總統計: avg.nas <- apply(my.data, 2, function(x) mean(is.na(x))) 這給了預期的結果:爲每個值的命名數字矢量柱。問題在於,這個值很難用於其他操作(比如將它加入到每個變量的描述中)。我知道我可以用一些sapply,rownames,t,,as.data.frame和突變的組合來獲得我想要的結果,但是有沒

    1熱度

    2回答

    x <- y <- 1:5 df = data.frame(m=x,n=y) myfun <- function(data, var) { library(dplyr) select(data, var) } myfun(df, m) 錯誤的eval(expr中,ENVIR,enclos):對象的 'm' 未找到

    35熱度

    3回答

    我有一個data.frame字符數據在其中一列中。 我想過濾來自同一列的data.frame中的多個選項。有沒有簡單的方法來做到這一點,我失蹤了? 實施例: data.frame名稱= dat days name 88 Lynn 11 Tom 2 Chris 5 Lisa 22 Kyla 1 Tom 222 Lynn 2 Lynn 我想濾除例如Tom

    10熱度

    3回答

    我想創建一個變量,其中包含組內前一年的變量值。 id date value 1 1 1992 4.1 2 1 NA 4.5 3 1 1991 3.3 4 1 1990 5.3 5 1 1994 3.0 6 2 1992 3.2 7 2 1991 5.2 value_lagged應該丟失時前一年的一個組內的缺失 - 或者是因爲它是一組