我想要做的是找到下面的代碼替代:SAS PROC SQL和內連接 - 什麼是替代方法
PROC SQL;
CREATE TABLE XXXX AS
SELECT DISTINCT t2.WC, t2.CWC
FROM YYYY t1
INNER JOIN ZZZZ t2 ON (t1.MC = t2.WC)
;
QUIT;
可能有人請使用哈希或任何其他做同樣的事情幫助方法?
我有以下表格:
data have01;
infile cards truncover expandtabs;
input MC $ LC $ MCC $ MCN $ TLC $ DD $ ODS_TimeStamp ODS_LUpd zTPl $ PuD $;
cards;
1853 DR14 1 Vetu SM3 . 24SEP2013:10:06:53.580 20JUL2016:12:55:39.240 0 .
1856 DR14 1 Vetu SM3 . 24SEP2013:10:06:53.580 20JUL2016:12:55:39.240 0 .
1869 DR14 1 Vetu SM3 . 24SEP2013:10:06:53.580 20JUL2016:12:55:39.240 0 .
2024 DV16 1 Vetu SM3 2008-01-31 24SEP2013:10:06:53.580 20JUL2016:12:55:39.240 47 .
2025 DV16 1 Vetu SM3 2008-01-31 24SEP2013:10:06:53.580 20JUL2016:12:55:39.240 47 .
run;
您可能必須在上表中格式化日期列。
data have02;
infile cards truncover expandtabs;
input WPMVId ToSTimeStamp TId ASN WC $ CWC $ TSide $ MNo Y X;
cards;
1 21AUG2012:17:57:39.000 20949 1 7604 HPUS230 R 1 -82140 2468
2 21AUG2012:17:57:39.000 20949 1 7604 HPUS230 R 2 -81940 2466
3 21AUG2012:17:57:39.000 20949 1 7604 HPUS230 R 3 -81739 2463
4 21AUG2012:17:57:39.000 20949 1 7604 HPUS230 R 4 -81539 2459
5 21AUG2012:17:57:39.000 20949 1 7604 HPUS230 R 5 -81339 2456
6 21AUG2012:17:57:39.000 20949 1 7604 HPUS230 R 6 -81139 2453
run;
您可能必須格式化上表中的日期列。
使用一些替代上面的SQL代碼,請幫助我,特別是當我有問題,上面我的表2是幾乎0.8十億行的數據,它需要地獄了大量的時間來運行如上SQL查詢。
我知道你的ID變量是WC和MC。他們沒有匹配的值。聯合集將是空的。 –
不,不,沒有數十億行數據。相信我,這只是樣本。 WC和MC在數據源中有共同的價值:) – ZeekDSA
800 Mio.的條目你肯定會遇到內存大小問題,因爲你的散列對象會變得非常大。這是新的信息。我將需要更新我的帖子。我會做,當我得到它:d –