去年我們推出http://tweetMp.org.au--致力於澳大利亞政治和Twitter的網站。需要歷史數據建模文獻,方法和技術
去年年底我們的政治家的架構進行調整,因爲一些政客退休和新的政治家走了進來。
改變我們需要手動(SQL)的變化,所以我正在考慮實施一個CMS爲我們的管理員做出分貝這些變化在未來。
還有許多其他網站,政府/政治網站在那裏的澳大利亞是管理自己的政治家的數據。
我想提出一個集中的方式來做到這一點。
思考了一段時間後,也許是最好的辦法是政治家的數據,以及他們如何涉及到政治制度的當前視圖未模型,而是模擬交易。這樣當前的觀點就是對過去發生的所有交易/變化的預測。
使用這種方法,其他網站可以「訂閱」的變化(一la` pubsubhub)並提交變更,只是這些變化的項目整合到他們的模式。
沒有這種做法,大多數網站將不得不推倒整個數據庫,並填充它,因此任何相關記錄將需要被關聯。以這種方式管理數據非常煩人,嚴重阻礙了這些數據爲了公共利益的混搭。
我注意到一些事情以這種方式工作 - 源代碼版本控制,銀行記錄,計算器積分系統和許多其他例子。
當然,眼前的挑戰和設計問題這種方法包括
- 是當前視圖緩存和repersisted?多久更新一次?
- 什麼基礎實體必須存在,永不改變?
- 大概堆更多,我不能想到現在...
是否有關於這個問題的任何顯着文學,任何人都可以推薦? 此外,像這樣的數據建模的任何模式或實踐可能有用嗎?
任何幫助,非常感謝。
-CV
數據倉庫體系結構中的更改跟蹤技術具有很好的技術(緩慢變化的維度),可以捕獲這種類型的東西。關於這一點的好處是它將大部分應用程序數據庫留在一個地方,其缺點是使追溯更改變得更加困難,而創建數據倉庫顯然可以是很多工作。如果人們對目前的歷史前進不滿意,並希望通過某些數據輸入追溯添加歷史記錄,或者經常不得不更正歷史記錄,那麼您必須構建工具來摒棄這些信息。 – AaronLS 2012-05-25 21:09:09