我希望你能幫助找到一個問題的答案,這個問題將成爲工作中反覆出現的主題。這涉及將數據從RDBMS表格非規範化爲具有跨列重複組(共享域和含義)的平面文件格式。不幸的是這是不可避免的。關係數據到平面文件
這裏是改造的一個非常簡單的例子,我會要求:
TABLE A TABLE B ------------------- 1 -> MANY ---------------------------- A_KEY FIELD_A B_KEY A_KEY FIELD_B A_KEY_01 A_VALUE_01 B_KEY_01 A_KEY_01 B_VALUE_01 A_KEY_02 A_VALUE_02 B_KEY_02 A_KEY_01 B_VALUE_02 B_KEY_03 A_KEY_02 B_VALUE_03
這將成爲:
A_KEY FIELD_A B_KEY1 FIELD_B1 B_KEY2 FIELD_B2 A_KEY_01 A_VALUE_01 B_KEY_01 B_VALUE_01 B_KEY_02 B_VALUE_02 A_KEY_02 A_VALUE_02 B_KEY_03 B_VALUE_03
從TABLE A
每個入口都會有一行與一個輸出平面文件每個相關字段的列數爲TABLE B
。輸出文件中的列可以具有從TABLE B
獲得的字段的空值。
我意識到這將創建一個非常寬文件,但這是一個要求。我看了一下MapForce和Apatar,但我認爲這個問題太奇怪了,或者我不能正確使用它們。
我的問題:是否已經有一個工具可以完成這個工作,或者我應該從頭開始開發一個工具(我不想重新發明車輪)?
這是標準「表中的行到結果中的列」問題?這並不奇怪,這很常見。在SO和Google上搜索「表格行到結果列」。根據您閱讀的內容更新此問題。 – 2009-12-10 11:51:34
謝謝,我周圍環顧四周,沒有發現同樣的問題 - 我可能只是沒有說清楚。我會考慮如何讓這個問題的微妙之處更加明顯。 – Anthony 2009-12-10 13:20:26