我有一個逗號分隔格式的文本文件。每行有兩列,每列有整數值。 Like在1000萬行中查找記錄
12334,23433
23234,45663
234422,324545
324543,23433
143233,23433
.....
重複第二列中的值。我需要做的是在第一列中找到第二列具有相同值並在一行中表示它們的所有值。像上面的數據:
23433 12334,324543,143233
45663 23234
324545 234422
我所做的是以下幾點:
使用逗號- 導入的文本文件導入到SQL Server表(,)作爲分隔符 。
- 從每行代碼中讀取文本文件。
- 以逗號(,)爲基礎的分割線並使用第二列值向SQL Table發送 查詢。
- 將結果存儲在字典數據結構中,其中鍵爲第二列 並將所有結果連接起來形成第一列值。
- 畢竟處理完畢後,遍歷字典並將其寫入一個文件中。
這絕對是花費太多時間。我用C#編寫代碼。 T-SQL中的任何解決方案都可以工作。
任何幫助來優化它。
指數可能? – leppie 2013-02-10 17:03:26
如何向我們展示您正在使用的查詢? – vcsjones 2013-02-10 17:03:51
我對此一無所知,但我會假設你可以在很大程度上縮短檢查時間,如果你只是檢查每個數字中的第一個字節,並將其他所有內容放在新表格中,然後釋放原始表格(釋放內存),然後用第二個字節重複該過程,依此類推,直到完成最大數目字節的數目爲止。 – 2013-02-10 17:04:40