我們使用谷歌的BigQuery星火連接器導入存儲在文件拼花BigQuery內的數據忽略未知值。使用自定義工具,我們生成了BigQuery所需的模式文件,並在我們的導入代碼(Scala)中引用它。谷歌的BigQuery星火連接器:如何在追加
然而,我們的數據並沒有真正遵循固定和明確的架構,並在某些情況下,附加列可以被添加到個人數據集。這是使用命令行工具bq
我們幾乎總是用--ignore_unknown_values
否則許多進口將失敗與BigQuery實驗時爲什麼。
不幸的是,我們無法找到使用BigQuery星火連接器com.google.cloud.bigdataoss:bigquery-connector:0.10.1-hadoop2
同等配置選項。它存在嗎?
Thx用於說明。我們將考慮修補連接器。 –