我有數據庫,它有一個實際上攜帶兩個(用「;」分隔的字符串)的屬性。就以下面的例子來看看:水壺:ETL標準化分割字符串字段
例
這是一個有像這樣的表我的數據庫(來源):
事實上,這似乎一切ok ,但是當你認爲author
可以有一個或多個入口。你有這樣的記載:
文件(ID 1,作者 「約翰·馬特;瑪麗騎士」,抽象 「Lorem存有......」 年 2015年)
其中a_id
從表Authors
是一個外鍵表012引用。
在首先保證我將填補所有的作家(其中有與沒有問題),然後分配作者羣到各自的文件(這是問題),因爲我可以有這種情況
作者(ID 1,名 「約翰·馬特」) (ID 2,名 「約翰·馬特」) (ID 2,名 「瑪麗騎士」)
請注意,id 2將成爲參與上一個示例的插入。
問:
如何這個程序可以使用使用水壺的ETL過程來完成? 這是一個很好的實踐或由「;」分隔的字符串屬性它夠好嗎?
我已經做了你的建議。主要問題是如何從groupauthor表中獲取唯一標識並將其放回到數據庫B(目標)的文檔表中,而不是字符串「John Matt; Mary Knight」。 – ePascoal