考慮下表「鳴叫」如何從數據庫中刪除重複的條目?
tweet_id call_id id_str timestamp text
--------------------------------------------------
1 11 12345 312323134 lorem ipsum
2 11 12345 312323134 lorem ipsum
3 11 12345 312323134 lorem ipsum
4 11 12345 312323134 lorem ipsum
5 11 67890 325565454 dolor
6 11 34355 333544664 samet
每鳴叫應僅在數據庫中出現一次。正如你所看到的,除了tweet_id(它是一個自動編號字段)之外,完全相同的tweet(相同的call_id,id_str,時間戳和文本 - 除此之外所有內容都是相同的)已被存儲4次(!)
有沒有一種方法可以精確匹配(所以:除了tweet_id以外,其他都一樣),然後刪除最後一個x - 1(這裏:4 -1 = 3)?換句話說,在清理表看起來像
tweet_id call_id id_str timestamp text
--------------------------------------------------
1 11 12345 312323134 lorem ipsum
5 11 67890 325565454 dolor
6 11 34355 333544664 samet
我希望有一個簡單的方法來做到這一點,否則我有一個巨大的問題(顯示你其實你之前想到的一個小時是什麼把建立你的數據庫可以做!)
這個問題必須被回答了百萬次。 – usr 2012-03-31 21:10:29