2011-05-06 114 views
2

原始數據存儲在數據庫(多個表)中。它需要手動檢查並更正。檢查的數據應與原始數據一起存儲在數據庫中。在這種情況下,創建兩個單獨的數據庫(例如raw_data和checked_data)會是個好主意嗎?或者應該只有一個數據庫? 感謝如何將清理後的原始數據存儲在數據庫中?

回答

0

一般來說,在單個實例內工作比跨多個實例工作要容易得多。分佈式事務執行較慢。他們需要更多的輸入(總是需要添加數據庫鏈接)。這不僅僅是方便的問題,也是完整的問題。您可能希望確保給定的記錄要麼在RAW數據集中,要麼在CLEANSED數據集中,但不能同時存在。檢查這種事情在單個數據庫中更易於管理。

如何在單個數據庫中組織事物在某種程度上取決於您選擇的DBMS風格及其支持的內容。您可以擁有一個模式(用戶帳戶)並使用命名約定(如前綴),例如RAW_TABLE_1和CLEAN_TABLE_1。或者您可能想要使用不同的架構,這將允許您保留相同的表名,例如RAW_USER.TABLE_1和CLEAN_USER.TABLE_1。兩種方法都有優勢。始終提醒我們是否正在處理原始或乾淨的數據總是件好事。另一方面,我們可能有工具或應用程序,我們希望使用那些期望普通表名稱。同義詞可以在這方面提供幫助。

0

如果你的原始數據和校驗的數據都將是非常inormous不是僅僅使用兩個不同的數據庫

隨着正常化和使用過程中,您可以將其保持在一個數據庫中。

0

除了您自己的偏好之外,沒有推薦的方法。您可以將清理過的數據與原始數據一起存儲在同一個數據庫中,但存儲在不同的表中,並且可能在raw數據表中加入了類似raw_的內容。

否則,您可能爲每種類型的數據都有單獨的數據庫。好處是分離,因爲如果需要在這兩者之間完成,缺點是成本較高的Join等。

相關問題