2017-02-22 55 views
0

我有一個配置單元格式由pyspark dataframe_writer填充的配置單元表。 我需要將此表導出爲oracle.I在導出表時遇到問題,因爲sqoop無法分析orc文件格式。sqoop出口的配置單元獸表

是否需要使用sqoop命令指定用於導出配置元格表的任何特殊注意事項或參數。

回答

0

一個簡單的谷歌查詢指向blog post標記很明確......

如何Sqoop導出一個蜂巢ORC表到Oracle數據庫?

而且也存在SO post標記......

閱讀ORC文件並付諸RDBMS?

所以看來你沒有做任何研究。

順便說一下,您是否考慮使用Spark將數據直接通過JDBC發送到Oracle暫存表中,而不使用中間ORC轉儲?

+0

我做了我的研究,看到使用hcatalog的帖子,並試過it.I有一個錯誤,我需要重現要張貼在這裏。 – srini

0

我剛剛從ORAC到ORACLE的同一個sqoop。確保你有你的ORC表預先創建正確的數據類型,因爲你在數據框中有它們。列的相同順序也將緩解sqoop。如果您嘗試了任何命令,請將其發佈。