我一直保存文件爲.csv一年多,並將這些文件連接到Tableau Desktop,以便一些最終用戶(使用Tableau Reader查看數據)。使用postgres替換csv文件(大熊貓來加載數據)
我想我決定遷移到postgreSQL,我將使用熊貓庫to_sql來填補它。
- 我得到的每一天9個不同的文件,我處理他們每個人(我現在把它們合併成.csv.bz2格式月刊文件),通過添加列,計算,置換信息等
- 我創建兩個使用pd.concat和pd.merge的大量csv文件,其中包含Tableau連接到的 已處理文件。這些文件是從字面上覆蓋在添加新的數據每天這是費時
是否還好還是做我的文件連接和串聯與大熊貓和輸出數據導出到Postgres的?這將是我第一次使用真正的數據庫,與學習SQL語法和創建視圖或表格相比,我更喜歡熊貓。我只是想避免一遍又一遍地覆蓋相同的csv文件(以及其他一些我遇到的csv問題)。
每個問題有1個問題,目前這個問題過於寬泛 – EdChum
將其縮小到我的主要問題和我最猶豫的事情上(因爲當我閱讀數據庫時,我看到了很多關於規範化表格以及我和我最初的實現肯定不會那麼幹淨......我基本上將它用作一個大的平面文件來存儲數據並將Tableau連接到) – trench