0
我們將Hive表中的客戶數據和另一個Hive表中的銷售數據包含在TB中的數據中。我們正在嘗試爲多個客戶提供銷售數據並將其保存到文件中。將多個數據插入同一個數據框中
我們到目前爲止已經試過:
我們厭倦了左外客戶和銷售表之間的連接,但由於龐大的銷售數據,它不工作。
val data = customer.join(sales,"customer.id" = "sales.customerID",leftouter)
所以另一種方法是提取數據的形式銷售表根據客戶的特定區域列表,看看這個區域的數據有客戶資料,如果其他數據幀保存它存在的數據並加載數據到同所有區域的數據框。
我的問題在於,是否在spark中支持數據幀的多個插入數據。
OK,你可以在多個插入註釋到數據幀 – venkata
@venkata見我的編輯,我認爲它應該回答你的問題。 – Shaido