2016-12-26 62 views
0

我需要從每個我的知識流媒體數據流job.As訪問Bigtable的在轉型的一個訪問Bigtable的最佳做法有兩種方式:什麼是從數據流流

1),我們可以創建連接錯誤從doFn的startBundle方法到bigtable,並從processElement方法中的bigtable訪問數據。在這種方法中,每次新元素進入時,dataflow sdk都會創建與Bigtable的新連接。

2)在轉換obj創建時創建bigtable連接,並在processElement方法中使用該連接,但dataflow sdk創建obj,將其序列化並在工作節點中重新創建,那麼工作節點中的連接仍然是活動的嗎?或者在流媒體模式下,長時間打開bigtable連接是好事嗎?

或者是否有任何其他有效的方法來實現這一點。

謝謝。

回答

1

AbstractCloudBigtableTableDoFn維持我們能想到的最優化的方式,基本上是每個虛擬機一個單獨的連接。它有一個getConnection()方法,它將允許您以管理方式訪問Connection

FWIW,該類是在bigtable-hbase-dataflow項目,而不是DataflowSDK。

+0

感謝您的幫助... –