我有一些極端異常值將我的迴歸模型拋出,並使用If-Then-Else語句將它們刪除。然而,SAS完全消除了這些數據點,並在剩餘的數據點中找到了新的異常值。有沒有辦法從分析中刪除異常值,而不會在混合中投入更多?用If-Then-Else語句處理sas中的極端異常值
我計算Q3 + 1.5 * IQR,並使用該值作爲如此:
Data lungcancer; input trt surv age sex @@;
/* create a new variable diff */
diff = surv - 365;
/* create a new categorical variable resp */
If diff > 0 then resp= 1;
If diff <= 0 then resp= 0;
/* create a new categorical variable sev */
if 2276 > surv >= 1621 then sev=0;
Else If 456 <= surv <= 1620 then sev=1;
Else if 181 <= surv <= 455 then sev=2;
Else if 1 <= surv <= 180 then sev=3;
Else if surv > 2276 then delete; /* Remove outliers */
我不確定你的意思是尋找新的異常值。你能詳細解釋一下嗎?異常值的定義並不確切,刪除異常值並不一定是最佳實踐。 – Reeza
是@Reeza,我知道。我只是想了解當我刪除它們時分佈如何變化。你知道一種讓SAS計算學生殘差的方法嗎? – Jabernet
殘差意味着你必須從模型的預測。根據模型/ PROC,通常有報告各種殘差的選項。 – Reeza