dplyr

3熱度

1回答

我試圖做使用dplyr如下因素：假設你有data.framey和你想的基礎上var1 y <- data.frame(var1 = rnorm(100)) y$var2 <- 0 y$var2[y$var1 > 0.5] <- 1 值來創建一個新的變量是否可以使用dplyr的mutate和filter來做到這一點？

1熱度

1回答

dplyr：按組分組操作具有多個參數的函數

使用robCompositions包，我需要在組的基礎上推算缺失值。例如，使用虹膜數據集。 library(robCompositions) library(dplyr) data(iris) # Insert random NAs for (i in 1:4) { n_NA = sample(0:10, 1) index_NA = sample(1:nrow(iri

2熱度

1回答

在R中沒有循環的綁定

我可以使用循環來回答這個問題，我想不用（最好在dplyr或plyr中）。我有一個數據幀和國家的名單 Data <- data.frame( Date = c(2012:2014,2014,2013:2014), Value = rnorm(6), ) Countries <- c("AUS","USA","UK") 數據幀看起來像這樣 Date Value 1 2

4熱度

1回答

大規模唯一值的工作（for循環，應用或plyr）

我不知道這是可能的，但如果它是，它將使生活是如此的效率高得多。普遍的問題，這將是有趣的更廣泛的SO社區：for循環（和鹼功能類似於申請）適用於一般/一貫作業，如添加X到的數據幀的每列或行。我有一個普通/一致的操作我要執行，但對於數據幀中的每個元素的獨特值。有沒有辦法比子集化我的數據幀的每一個分組，應用相對具體的數字的函數來分組，然後重新組合更有效地做到這一點？我不在乎它是否爲for循環或適用，

0熱度

1回答

一個數據幀的傳遞兩列pwr.t.test

我想通過以下對pwr.t.test： > twelve fail sampsize sd 1 0.047619 21 0.9759 2 0.000000 28 0.0000 3 0.000000 1 0.0000 4 0.000000 13 0.0000 5 0.000000 1 0.0000 6 0.000000 1 0.0000 7 0.000000

17熱度

1回答

dplyr：如何將do（）應用於group_by的結果？

我想使用dplyr將一個表按一列分組，然後將函數應用於每個組的第二列中的一組值。例如，在下面的代碼示例中，我想返回每個人所吃的食物的2項組合。我無法弄清楚如何在do()功能中正確提供功能和正確的色譜柱（食品）。 library(dplyr) person = c('Grace', 'Grace', 'Grace', 'Rob', 'Rob', 'Rob') foods = c('apple

0熱度

2回答

使用R中的選擇功能時出錯

我想獲得用戶最常播放的歌曲。這三個領域我想在csv文件是用戶id，songId和playCount但選擇功能給了一個錯誤： write.csv(group_by(mydata,userId) %.% summarise(one=max(playCount)) %.% select(userId,songId,playCount), file="FavouriteSongs.csv") Er

26熱度

1回答

dplyr總結（）與多個返回值從單一功能

我想知道是否有使用功能與summarise（dplyr 0.1.2），即（從psych包實例describe功能）返回多個值的方法。如果不是，它只是因爲它尚未實施，或者是有一個原因，它不會是一個好主意？實施例： require(psych) require(ggplot2) require(dplyr) dgrp <- group_by(diamonds, cut) describe

44熱度

6回答

使用dplyr（個案刪除）過濾data.frame中的完整個案

是否可以使用dplyr過濾完整個案的data.frame？當然，complete.cases列出了所有變量的作品。但是，a）當有很多變量時是冗長的，b）當變量名稱未知時（例如，在處理任何數據幀的函數中），不可能。 library(dplyr) df = data.frame( x1 = c(1,2,3,NA), x2 = c(1,2,NA,5) ) df %.%

17熱度

2回答

如何使用dplyr將函數應用於所有非group_by列？

我試圖使用dplyr包的功能應用到一個data.frame所有列未進行分組，其中我會做aggregate()： aggregate(. ~ Species, data = iris, mean) 其中mean被應用到所有列不用於分組。（是的，我知道我可以使用集合，但我想了解dplyr。）我可以使用summarize這樣的： species <- group_by(iris, Species