2011-08-12 15 views
1

我越來越糊塗了,當我試圖比較塔塔和R.我使用例如在網頁上http://www.ats.ucla.edu/stat/stata/webbooks/logistic/chapter2/default.htm 首先運行以下命令給出的結果一致在Stata塔塔和R結果不Logistic迴歸有兩個分類預測及其相互作用

命令
use http://www.ats.ucla.edu/stat/stata/webbooks/logistic/apilog, clear 

,然後使用以下的部分(2.2.2 A 2由2佈局與主效應和相互作用)

generate cred_ed = cred_hl*pared_hl 
logit hiqual cred_hl pared_hl cred_ed 

給定命令這兩個命令將產生的結果給定上網絡頁。

然後我用下述R代碼來重現同樣的例子

Data<- read.csv("Book1.csv",header=T) 
data.glm<-glm(hiqual~cred_hl + pared_hl + cred_hl*pared_hl,family=binomial, data=Data) 
summary(data.glm) 

但結果不匹配!

對R數據文件可以下載從下面的鏈接

https://spreadsheets.google.com/spreadsheet/ccc?key=0Ajt182RLsguldFlLQmd6Z1ZoczJCenJIdmREUkhxTFE&hl=en_US

注:結果只有主效應模型進行匹配,但是當我們有互動,這是不匹配的。

在此先感謝。

+0

根據您的評論如下:「我意識到數據選擇和形成存在問題。」,我正在關閉它。如果你覺得這應該重新打開,然後標誌我們的關注。 – Kev

回答

4

他們給我同樣的結果(使用ucla的數據)。

library(foreign) 
d1 <- read.dta('http://www.ats.ucla.edu/stat/stata/webbooks/logistic/apilog.dta') 
m1 <- glm(hiqual~cred_hl + pared_hl + cred_hl*pared_hl,family=binomial, data=d1) 
+0

謝謝。我意識到在數據選擇和形成方面存在問題。 – Iftikhar