2017-02-24 79 views
0

我是新來攆,得到了一些東西來解析格式蜂巢定製SERDE

[Time Stamp] {Complex JSON data} 

的日誌。

我可以擴展這些JSON Serde代碼以適合我的需要嗎?如果是的話,哪個JSON serde代碼可以更好地選擇?

如果這種方法不好,還有其他指針嗎?

感謝

回答

0

而不是使用任何其他開源SERDE的,

我發現寫自己SERDE要簡單得多。除了鍋爐板代碼外,我只需用反序列化方法編寫我的業務邏輯,就像魅力一樣。

此鏈接非常有幫助。 http://blog.cloudera.com/blog/2012/12/how-to-use-a-serde-in-apache-hive/

此外,我嘗試使用UDTF,這工作順利,發現serde更快。

希望這可以幫助別人