2012-03-22 118 views
0

我有2個數據集。 1包含origin_zip(number)和destination_zip(char)和tracking_number(char)列,另一個包含zip。比較數據集

我想比較這兩個數據集,以便我可以看到不在第二個數據集的zip列中的所有跟蹤編號和destination_zips。

此外,我想看到所有的tracking_numbers和origin_zips其中origin_zips = destination_zips。

我該如何做到這一點?

origin_zip destination_zip tracking_number 
12345   23456    11111 
34567   45678    22222 
12345   12345    33333 

zip 
12345 
34567 
23456 

results_tracking_number 
22222 
33333 
+0

發表您的數據和期望的輸出 – 2012-03-22 18:56:54

回答

0

讓我們先從這個...我不認爲這完全回答你的問題,但跟進的意見,我會幫助,如果我能...

data zips; 
input origin_zip $ destination_zip $ tracking_number $; 
datalines; 
12345   23456    11111 
34567   45678    22222 
56789   12345    33333 
; 

data zip; 
input zip $; 
datalines; 
12345 
54321 
34567 
76543 
56789 
; 

Proc sort data=zips; 
by origin_zip; 
run; 

Proc sort data=zip; 
by zip; 
run; 

Data contained not_contained; 
merge zip(in=a) zips(in=b rename=(origin_zip=zip)); 
by zip; 
if a and b then output contained; 
if a and not b then output not_contained; 
run;