這是交易;問題不在於獲取CSV到SQL Server,它得到它的工作方式,我想如何...我認爲總是這個問題:)使用SSIS從CSV導入最新的數據到SQL Server
我有一個CSV文件,列如:DATE, TIME, BARCODE, etc...
我使用一個派生列轉換,將DATE
和TIME
連接成一個DATETIME
,用於導入SQL Server,並將所有數據導入數據庫。問題是我們每12小時纔會得到一個新的.CSV文件,例如我們會說.CSV會在一分鐘內更新四次。
有了我們每15分鐘運行一次這個工作的邏輯,我們將得到大量的重疊數據。我想我會使用一個變量,如LastCollectedTime
,它可以使用MAX(READTIME)
從我的SQL數據庫中提取。我的問題是因爲我只想收集具有比該變量更近的readtime的行。
目的地表結構: ID, ReadTime, SubID, ...datacolumns..., LastModifiedTime
其中LastModifiedTime
的最後一個插入的默認值爲GETDATE()
。
任何想法?記住,我們的閱讀時間是一個派生列,不知道它是否重要。
不是在這種情況下,沒有。該供應商已經設置爲不斷加載到.csv 12小時,然後開始一個新的.csv - 這是我們的控制 – Tom