我有一個不幸的運氣,不得不處理包含特定記錄重複的數據庫,我正在尋找一種快速方式來說「獲取最多的記錄並更新重複項以匹配它」。如何選擇最豐富的記錄?
從那裏我可以選擇不同的記錄並獲得一組有用的記錄。
任何想法?
這是主要的名稱和地址是否有幫助?
好了很多的問題要求在這裏,我得加點點:
首先,我想拉「填充」最不最「流行」,這意味着值最大的行不是null。
一旦我有了設置(這很容易,因爲在我的情況下id的匹配),我可以填充其他行中的缺失值。
我不想破壞數據,我只打算根據精確匹配(例如通過id)更新數據。
我現在的問題是搞清楚哪一組行中有最多填充的字段,說過自發布這個問題以來,我發現了一種不同的方式來解決我發送到遠程的更大問題服務器,但我仍然有興趣知道這個解決方案可能是什麼。
的樣本數據可能是這個樣子......
id name addr1 addr2 ect
1 fred 1 the street Some town ...
1 fred null null null
給出一個完整的匹配對這樣的表,我想找到的對然後抓住一個在它的信息,並將這些值,其中另一行有一個空值。
如何重複的記錄呈現的?所有字段是相同的?只有ID是不同的? – Oded 2010-07-02 14:43:41
另外,什麼定義,「最流行」? – 2010-07-02 14:44:52
@Tom H. - 我認爲這意味着大部分重複的記錄。 – Oded 2010-07-02 14:46:48