2016-05-31 150 views
3

我以合適的格式提供我的數據,Apache drill無法支持這些數據。 有沒有關於如何編寫我自己的存儲插件來處理這些數據的教程。如何爲apache drill編寫自定義存儲插件

+1

它是某種RDBMS嗎?如果是的話,你可以定義你的插件。如果這是別的,你必須爲該插件編寫代碼。 –

+0

儘管它不是一個RDBMS,但我們確實有支持SQL的工具,如在該數據集之上的語言。 – sushil

回答

10

這是真的應該在文檔中,但目前不是。界面不是太複雜,但是查看一個現有的插件並理解正在發生的一切可能有點多。

編寫存儲插件有兩個主要組件,將信息公開給查詢規劃器和模式管理系統,然後實際實現從數據源API到鑽取記錄表示的轉換。

最近添加了Kudu插件,它是一個合理的存儲系統模型,可以充分利用Drill的許多元素。我要指出的一件事是,如果你的存儲系統沒有被分配,並且你打算做所有的遠程讀取,你不必在組掃描中做很多的工作/工作列表/分配工作。如果我有一段時間了,我會嘗試在界面的不同部分寫一篇文檔,也許會寫一篇關於現有插件的教程。

https://github.com/apache/drill/tree/master/contrib/storage-kudu/src/main/java/org/apache/drill/exec/store/kudu

+0

這是我正在尋找的確切信息。我確實經歷了Hiva存儲插件,發現它太複雜了。 我有一個後續問題。實際編寫插件/模塊以在最終工作者節點上執行實際查詢的工作量有多少。我的意思不是隻是閱讀和提供記錄,我想要採取演習執行計劃並執行它。 – sushil

+0

@jaltekruse,我想要構建一個存儲插件,並希望有關此任何教程。有關於文件的消息嗎? –

+2

那麼你有沒有時間寫教程? :) –

相關問題