2016-08-18 30 views
0

我有兩個數據集在Excel中,我想加入但有一個重大轉折。這裏是我的數據看起來像:加入Rapidminer

enter image description here

請注意兩件事: 1的ID 3在Sheet1中的手機比在Sheet2的不同; 2-對於ID 4,在sheet2中有電話號碼,但沒有在sheet1中

我想要的是這兩張紙的組合,它們將包含所有信息。因此,缺少的值將被填充,並且每當有相同ID的2個不同值時,我想讓rapidminer創建一個包含其他值的附加列(例如:phonenumber1,phonenumber2)。

注意我不是一個非常技術性的人,因此讓我知道是否有一個簡單的解決方案,如果它很複雜,解釋我需要做的詳細步驟。

THX!

回答

1

Join運營商將做你想要的,如果你正確地設置其參數。首先,在閱讀電子表格後,將兩個示例集連接到Join運營商。將該運算符的key attributes設置爲IDage用於左鍵和右鍵。接下來,清除參數remove double attributes

運行該過程後,應該會看到更多列。