dplyr

    3熱度

    1回答

    我試圖做使用dplyr如下因素: 假設你有data.framey和你想的基礎上var1 y <- data.frame(var1 = rnorm(100)) y$var2 <- 0 y$var2[y$var1 > 0.5] <- 1 值來創建一個新的變量是否可以使用dplyr的mutate和filter來做到這一點?

    1熱度

    1回答

    使用robCompositions包,我需要在組的基礎上推算缺失值。例如,使用虹膜數據集。 library(robCompositions) library(dplyr) data(iris) # Insert random NAs for (i in 1:4) { n_NA = sample(0:10, 1) index_NA = sample(1:nrow(iri

    2熱度

    1回答

    我可以使用循環來回答這個問題,我想不用(最好在dplyr或plyr中)。 我有一個數據幀和國家的名單 Data <- data.frame( Date = c(2012:2014,2014,2013:2014), Value = rnorm(6), ) Countries <- c("AUS","USA","UK") 數據幀看起來像這樣 Date Value 1 2

    4熱度

    1回答

    我不知道這是可能的,但如果它是,它將使生活是如此的效率高得多。 普遍的問題,這將是有趣的更廣泛的SO社區:for循環(和鹼功能類似於申請)適用於一般/一貫作業,如添加X到的數據幀的每列或行。我有一個普通/一致的操作我要執行,但對於數據幀中的每個元素的獨特值。 有沒有辦法比子集化我的數據幀的每一個分組,應用相對具體的數字的函數來分組,然後重新組合更有效地做到這一點?我不在乎它是否爲for循環或適用,

    0熱度

    1回答

    我想通過以下對pwr.t.test: > twelve fail sampsize sd 1 0.047619 21 0.9759 2 0.000000 28 0.0000 3 0.000000 1 0.0000 4 0.000000 13 0.0000 5 0.000000 1 0.0000 6 0.000000 1 0.0000 7 0.000000

    17熱度

    1回答

    我想使用dplyr將一個表按一列分組,然後將函數應用於每個組的第二列中的一組值。 例如,在下面的代碼示例中,我想返回每個人所吃的食物的2項組合。我無法弄清楚如何在do()功能中正確提供功能和正確的色譜柱(食品)。 library(dplyr) person = c('Grace', 'Grace', 'Grace', 'Rob', 'Rob', 'Rob') foods = c('apple

    0熱度

    2回答

    我想獲得用戶最常播放的歌曲。這三個領域我想在csv文件是用戶id,songId和playCount但選擇功能給了一個錯誤: write.csv(group_by(mydata,userId) %.% summarise(one=max(playCount)) %.% select(userId,songId,playCount), file="FavouriteSongs.csv") Er

    26熱度

    1回答

    我想知道是否有使用功能與summarise(dplyr 0.1.2),即(從psych包實例describe功能)返回多個值的方法。 如果不是,它只是因爲它尚未實施,或者是有一個原因,它不會是一個好主意? 實施例: require(psych) require(ggplot2) require(dplyr) dgrp <- group_by(diamonds, cut) describe

    44熱度

    6回答

    是否可以使用dplyr過濾完整個案的data.frame?當然,complete.cases列出了所有變量的作品。但是,a)當有很多變量時是冗長的,b)當變量名稱未知時(例如,在處理任何數據幀的函數中),不可能。 library(dplyr) df = data.frame( x1 = c(1,2,3,NA), x2 = c(1,2,NA,5) ) df %.%

    17熱度

    2回答

    我試圖使用dplyr包的功能應用到一個data.frame所有列未進行分組,其中我會做aggregate(): aggregate(. ~ Species, data = iris, mean) 其中mean被應用到所有列不用於分組。 (是的,我知道我可以使用集合,但我想了解dplyr。) 我可以使用summarize這樣的: species <- group_by(iris, Species