我有一個實例從具有3個不同屬性的數據幀中提取:Atr1,Atr2和Atr3。另一方面,我有一個包含4個屬性的數據框:Atr1,Atr2,Atr3,Atr4,但Atributes Atr1,Atr2和Atr3與前面提到的實例相同。我有這樣的事情:如何檢查實例是否位於pyspark中的數據框中並從數據框中獲取出現?
Instance:
[Row(Atr1=u'A', Atr2=u'B', Atr3=24)]
Dataframe:
+------+------+------+------+
| Atr1 | Atr2 | Atr3 | Atr4 |
+------+------+------+------+
| 'C' | 'B' | 21 | 'H' |
+------+------+------+------+
| 'D' | 'B' | 21 | 'J' |
+------+------+------+------+
| 'E' | 'B' | 21 | 'K' |
+------+------+------+------+
| 'A' | 'B' | 24 | 'I' |
+------+------+------+------+
所以,有上述情況,我要檢查它是否在與屬性ATR1,ATR2和ATR3這些值數據幀存在一個實例,如果它存在,請Atr4的值。在這種情況下,'我'。
@jartymcfly請不要忘了[將其標記爲正確的答案(https://stackoverflow.com/help/someone-answers)是否能解決你的問題 :) – Prem