MYSQL從100萬行的表中選擇不同的（indexed_column）

編輯：實際上除了選擇不同（我還沒有驗證）之外，主要性能瓶頸可能是網絡速度，當服務器和客戶端都是在本地主機上，選擇所有2個milion記錄花了36秒，但是，在客戶坐在另一個盒子上的（假定是高速）網絡上，查詢在10分鐘後還沒有完成。
這應該是100mbps的網絡，但是當我檢查客戶端（java jdbc）時，它以3kb /秒的速率接收數據。但是，MySQL服務器以100kb /秒的速度發送（儘管包括其他客戶端連接）。爲什麼java jdbc客戶端以如此低的速率接收數據？MYSQL從100萬行的表中選擇不同的（indexed_column）

 
select distinct(indexed_column) from mytable

對mytable只有100萬行非常慢，indexed_column是一個非唯一索引。有沒有一種方法來優化它？的解釋給出了這樣的：

 
id | select_type | table  | type | possible_keys | key    | key_len | ref | rows | Extra  
| 1 | SIMPLE  | mytable | range | NULL   | my_index | 50  | NULL | 1759002 | Using index for group-by |

並鍵入=範圍意味着它不使用索引？這就是爲什麼它很慢？

來源

2011-02-25 user121196

EXPLAIN對queryplan有什麼看法？ http://dev.mysql.com/doc/refman/5.5/en/explain.html – 2011-02-25 11:11:35

什麼是'非常緩慢'？以及該列的數據類型是什麼？ – krtek 2011-02-25 11:15:34

@Frank：這就是所有的解釋選擇說 – user121196 2011-02-25 11:16:18

我會在桌子上建立一個唯一索引，列上你想要的「不同」 ......

因此你找DISTINCT在給定的列。如果您在一列（或多列）上構建UNIQUE INDEX，則您正在尋找不同的組合，索引頁面將只保存指向符合此組合的第一條記錄的指針。

例如：如果你有

Category Count 
1   587 
2   321 
3   172 
4   229 
5   837

您對類UNIQUE INDEX只會有5條......在這種情況下，在5個類別，即使超過2000項，在單獨的類別數爲5，索引有5個，你就完成了。將這個概念應用到您的100萬條記錄表中。

來源

2011-02-25 13:39:01 DRapp

這一列雖然不是唯一的，但它可能有嘟嘟聲 – user121196 2011-02-25 14:27:47

@ user121196，請參閱更新 – DRapp 2011-02-25 14:47:45

其實我只是意識到索引是唯一的，問題是我的數據幾乎是不同的（幾乎沒有dups），我猜這是選擇不同，這很慢，因爲在我將查詢更改爲SELECT之後，它在36秒內完成。選擇DISTINCT從來沒有完成（我在6小時後殺死它），它只有大約200萬條記錄，我不能使用SELECT DISTINCT？ – user121196 2011-02-25 15:02:05

MYSQL從100萬行的表中選擇不同的（indexed_column）

回答

相關問題