2016-11-17 45 views
2

我試圖重新處理ga_sessions_yyyymmdd數據,但我發現ga_sessions從未使用過一個名爲[channelGrouping]的字段,但它在更新的數據中有效。如何處理BQ GA導出更改?

所以,我的職位工作的優良ga_sessions的最新版本,但是當我嘗試重新處理earleir ga_sessions數據的工作,因爲它缺少了[channelGrouping]字段失敗。

顯然通常這是你想要的,但在這種情況下,它不是。我想確保我堅持使用最新的ga_sessions模式,並希望工作將缺少的cols設置爲null,因爲它們不存在時。

有沒有辦法解決這個問題?

也許我需要創建一個名爲ga_sessions_template_latest的空表,並將它與我正在處理的任何ga_sessions_每日表結合 - 也許這會將舊ga_sessions「升級」到新結構。

附上的正是我的意思(我的工會的想法實際上是可怕由於ga_sessions嵌套字段)的屏幕截圖。 enter image description here

+0

嘗試將SQL Legacy記錄到SQL Query中,第二個由Google在發生之前像這樣發生時推薦。尋找更多信息: https://cloud.google.com/bigquery/docs/reference/standard-sql/ 這是哪裏的模式失敗 胎面http://stackoverflow.com/questions/40654768/how -to-手柄-BQ-GA-出口變化 –

回答

1

我沒有這樣的劇本呢。但由於表格在您的項目下,因此您可以更新它們。您可以編寫腳本並更新所有包含最近模式集中缺少列的表上的模式。

  • 我想象一個獲取最新表格模式的腳本。
  • 然後返回一個一個過去的表,做一個比較,標識缺少的列,定義它們爲不是必需的,空的,並讀取架構+應用附加列,並運行表上的更新。數據不會被修改,您將只有其他列的空值。

你可以嘗試從Web UI有的還。