我想通過Google Dataflow將數據加載到Google CloudSQL實例中。 我認爲沒有內置的Sink for CloudSQL,我決定使用org.apache.beam.sdk.io.jdbc.JdbcIO。 但是,到CloudSQL的吞吐量非常低(約6條記錄/秒)。在Google Dataflow上使用JdbcIO的吞吐量非常低
我懷疑CloudSQL的規格太差,但升級後並沒有改進。
在日誌數據流中,有很多是記錄如下:
Proposing dynamic split of work unit my-project;2017-06-27_02_58_19-14077185378147382467;6703504927792172410 at
{"fractionConsumed":0.9669782519340515}
Rejecting split request because custom reader returned null residual source.
發生了什麼事?我該如何提高性能?