如何計算dplyr中每個另一列的每組數據組的百分比?dplyr每組百分比
df
包含以下記錄
A target
a 1
b 0
a 0
a 1
這完成了第一部分
df %>%
group_by(A) %>%
summarise (n = n())
這第二
df %>%
group_by(A, target) %>%
summarise (n = n(), target_sum = sum(target))%>%
filter(target == 1) %>%
mutate(freq = n/target_sum)
但商從取自
在蟒蛇/大熊貓
grouped = df_original.groupby(['A', 'target']).size()
df = (grouped/grouped.groupby(level=0).sum())
grouped = df.reset_index(name='percentageA')
groupedOnly = grouped[grouped.target == 1]
會達到理想的計算用的結果:
a 1 0.666667