0
我的上下文是;Hadoop攝入自動化技術
10個csv文件在夜間上傳到我的服務器。
我的過程是:
食入:
- 放在HDFS 文件
- 創建ORC蜂巢表,並把他們的數據。
處理:
- 星火處理:改造,清洗,加入....
- 很多鏈接步驟(火花作業)
我搜索最佳實踐來自動化第一部分並觸發第二部分。
- Cron,sh,dfs put。
- Oozie?
- Apache Nifi?
- Flume?
- Telend :(
我也看https://kylo.io/,這是完美的,但我覺得還是年輕了,把它投入生產。提前
感謝。
此解答是否有用?你有跟進問題嗎? – alpeshpandya
有用,謝謝你的回覆。 – Nabil