2017-06-20 54 views
-4

嗨,我真的很陌生,我很難實現我附上csv文件的代碼,我需要創建一個表格,顯示男性和女性的平均工資CSV file for the data 請問你們有這些問題:R編程表創建

Q1。 使用R創建一個表格,顯示被放置的男性和女性的平均工資。檢查數據中是否存在性別差異。換句話說,觀察這個數據集中男性的平均工資是否高於女性的平均工資。並且我還需要運行 t檢驗來測試以下假設: H1:男性MBA的平均薪水高於女性MBA的平均薪水。

+5

向我們展示您的嘗試。我們不在這裏爲你做你的工作。並請參閱https://meta.stackoverflow.com/questions/284236/why-is-can-someone-help-me-not-an-actual-question – GhostCat

回答

0

請參閱GhostCat關於提問的評論鏈接。話雖如此,以下可能會幫助你找出如何去做你所要求的。

有一些您可能需要熟悉的方便功能。要閱讀csv文件,您需要運行read.csv,您可以在其中按Tab鍵通知您可輸入的參數 - 例如,header = TRUE表示csv的第一行僅爲標題信息。

dat <- read.csv(file = "~\WHERE\FILENAME.csv", header = TRUE) 

要保存任何對象保存爲data.frame你可以使用as.data.framedata.frame功能。

df <- as.data.frame(dat) 

要將data.frame按某個值拆分成不同的列表,可以使用split函數。

df_Gender <- split(df, df$Gender) 

上列出工作的最佳方法是熟悉apply系列函數(查看完整的可運行和解釋R Grouping functions: sapply vs. lapply vs. apply. vs. tapply vs. by vs. aggregate)。

如果您在處理一個步驟時遇到非常麻煩的問題,請在發佈問題之前瘋狂搜索。祝你好運。

+0

我是新來的這個,所以抱歉發佈惱人的整個問題。我的不好 –

+0

我爲表格創建了一個數據框,現在我想在某個列的這個表中找到平均值。 **> dean.df < - table(mba.df $ Gender,mba.df $ Placement) >查看(dean.df)** –

+0

所以我添加了平均函數'dean.df < - table(mba.df $ Gender,mba.df $ Placement,mean) 表中的錯誤(mba.df $ Gender,mba.df $ Placement,mean): 所有參數必須具有相同的長度' –