假設我們僅限於使用SAS並具有面板/縱向數據集。我們有隊列和時間指標,以及一些測量變量y
。使用SAS對不平衡面板數據進行插值
data in;
input cohort time y;
datalines;
1 1 100
1 2 101
1 3 102
1 4 103
1 5 104
1 6 105
2 2 .
2 3 .
2 4 .
2 5 .
2 6 .
3 3 .
3 4 .
3 5 .
3 6 .
4 4 108
4 5 110
4 6 112
run;
注意,隊列和時間的單位是相同的,所以,如果數據集出去時間單元6中,每個連續的面板單元將是一個週期比在時間之前它的一個更短。
我們在實際數據之間有兩個面板單位的差距。我們的目標是從兩個「夾心」它們的線性內插兩個缺失的面板單元(第2組和第3組的值)。對於時間5處的羣組2,內插值應該是0.67*104 + 0.33*110
,而對於時間5處的羣組3,它將是0.33*104 + 0.67*110
。基本上你只是用實際的重量較輕的面板單元重量的2/3,而另一個面板單元的重量只有1/3。你當然會有缺失的值,但對於這個玩具的例子來說,這不是問題。
我想象的解決方案涉及滯後和使用first.
運算符和循環,但我的SAS是如此之差,我猶豫提供甚至我破碎的代碼示例。
發佈您到目前爲止所嘗試的內容。你有SAS/ETS嗎? – Reeza